关于提高电力广域网可靠性的探讨

时间:2022-10-06 08:08:54

关于提高电力广域网可靠性的探讨

摘要:对供电企业广域网的可靠性需求进行了分析,介绍了影响网络可靠性的技术,通过对广域网建设和运维的五个方面进行探讨分析,提出了在不同层面提高电力广域网可靠性的措施。

关键词:电力广域网;安全防护;技术实验

作者简介:王建宇(1974-),女,山东泰安人,泰安供电公司,高级工程师;张甫东(1972-),男,江苏邳州人,国家电网技术学院信息中心,高级实习指导教师。(山东 泰安 271000)

中图分类号:TM7 文献标识码:A 文章编号:1007-0079(2013)08-0184-02

进入“十二五”以来,国家电网公司根据自身业务的发展,作出了全面建设坚强智能电网、加快构建“三集五大”科学管理体系的决策部署。“三集五大”管理体系是以信息化为前提,推动信息化与核心业务流程、核心业务流程与核心资源的深度融合,充分发挥信息资源的价值。

电力广域网是公司“三集五大”体系建设的重要支撑和保障。目前,国家电网公司各项业务已与信息化深度融合,“三集五大”体系核心业务数据、典型业务流程、关键业务环节高度依赖于信息化在线处理。加强通信基础设施建设,加快推进电力广域网建设和覆盖,提升电力广域网可靠性,是“五大”体系尤其是“大运行”体系推广建设创造基本条件。本文对电力广域网可靠性需求进行了分析,介绍了影响网络可靠性的技术,通过对广域网建设和运维的五个方面进行探讨分析,提出了在不同层面提高电力广域网可靠性的措施。

一、网络可靠性的定义

根据国家标准GB-6583的规定,产品的可靠性是指:设备在规定的条件下、在规定的时间内完成规定功能的能力。对于网络系统的可靠性,除了耐久性外,还有容错性和可维护性方面的内容。

耐久性是指设备运行的无故障性或寿命,也称为平均无故障时间(Mean Time Between Failure,MTBF),它是描述整个系统可靠性的重要指标。对于一个网络系统来说,MTBF是指整个网络的各组件(链路、节点)不间断无故障连续运行的平均时间。

容错性也称为系统平均恢复时间(Mean Time to Repair,MTTR),是描述整个系统容错能力的指标。对于一个网络系统来说,MTTR是指当网络中的组件出现故障时,网络从故障状态恢复到正常状态所需的平均时间。

可维护性。在系统发生故障后,能够很快地定位问题并通过维护排除故障,这属于事后维护;根据系统告警提前发现问题(如CPU使用率过高,端口流量异常等),通过更换设备或调整网络结构来规避可能出现的故障,这属于预防维护。可维护性需要管理人员来实施,体现了管理的水平,也反映了系统可靠性的高低。

可描述系统可靠性的公式为:MTBF / ( MTBF + MTTR ) * 100%。从公式或以看出,提高MTBF或降低MTTR都可以提高网络可靠性。造成网络不可用的因素包括:设备软硬件故障、设备间链路故障、用户误操作、网络拥塞等。针对这些因素采取措施,使网络尽量不出故障,提高网络MTBF指标,从而提升整网的可靠性水平。

二、提高电力广域网可靠性的技术

构建具有高可靠性的广域网,是一个复杂的系统工程,一方面,广域网的建设贯穿网络规划、设计、部署实施、维护等各个阶段;另一方面,广域网要求提供设备、链路、服务、应用等各种级别的可靠性特性。

从整个网络角度看,广域网的可靠性设计在企业网络基础设施规划中占据更重要的位置。在当前应用大集中的背景下,因地域跨度大、链路质量不可控、多业务承载带来的应用复杂提升以及网络虚拟化等因素,对路由器的高可靠性提出了新的要求。比如,由于网络规模越来越大,同一个AS域里路由器设备数量越来越多,对路由的快速收敛能力要求越来越高;网络接入资源的虚拟化趋势导致可靠性设计从物理链路向虚拟化隧道转化;网络多出口导致对用户具体应用质量影响的分析与判断等等都是当前广域网可靠性规划设计的新课题。

提高广域网可靠性技术可分为以下几个层面:设备级高可靠性技术,采用全分布式架构设计、主控冗余、交换网冗余、电源风扇冗余等;链路高可靠性技术,采用链路捆绑、环网等技术;协议高可靠性技术,采用动态路由快速收敛(如快速hello,ospf的增量spf技术),快速重路由(IP/MPLS/VPN快速重路由),不间断转发(NSF/GR/NSR),快速故障检测等技术;面向应用的高可靠性技术,采用基于应用质量的链路探测技术NQA、动态负载分担等技术;机房基础设施的高可靠性保障技术;机房电气高可靠性技术(采用机房多接地措施,使用气体灭火装置,冗余专用空调系统等);一体化调度保障技术,建立多级运维监控体系,建立快速应急处理机制等;新设备、新方案的测试试验技术,在专用测试环境对新设备、新方案及优化技术进行检测和验证。

三、增强广域网可靠性的设计及应用

电力广域网承载的业务主要是生产管理大区和信息管理大区的各项应用系统业务,主要有电力调度MIS、ERP系统、办公系统、电子邮件系统、远程教学系统等,不仅承载数据业务,同时承载语音业务和视频业务。为建设具备电信级广域网,可在以下几方面采取相关技术提高网络的可靠性。

1.业务局域网层

业务局域网层一般指承载具体网络业务的局域网,可以是一个地市公司的生产调度网络,也可以是一个地市公司的信息数据网络,这个网络下联设备一般为用户电脑或专用生产数据采集终端。按照通用网络设计原则,业务局域网通常设计成多层星型结构,网络分为接入层网络,汇聚层网络和核心层网络。

在接入层网络中,由于设备直接下联网络终端,并且设备放置环境可能比较恶劣,因此需要采用以下技术提高接入可靠性。设备配备冗余电源;设备做好接地连接;设备工作电压宽泛,输入电压能够满足90V~260V,48HZ~63HZ的变化范围;国内北方地区和南方地区尽量采用宽温型号的设备;设备支持802.1X及基于端口带宽的广播风暴抑制技术,能够支持安全接入管控;设备支持链路汇聚,能够利用链路汇聚提高上行带宽。

在汇聚层网络中,设备汇集了多个接入层的各种流量,保护核心设备不受接入层的影响,该层设备承上启下,可以采用如下技术提高可靠性:设备配备双引擎、双电源,提高设备自身可靠性;将网络终端网关配置到汇聚设备上,隔离二层网络风暴,保护核心网络不受局部故障的干扰;双设备配置,为接入设备提供双归属上行链路,通过VRRP等协议实现网关的冗余备份和流量的负载分担。

核心层网络中,设备下联汇聚设备,上联安全设备,通过安全设备连接系统广域网的骨干接入路由器。核心层设备是业务局域网的数据中转核心,需要能提供快速的数据交换和极高的永续性。可以采用如下设计提高可靠性:单个设备配备双引擎,双电源,双交换网,双业务板,提高设备自身可靠性;采用双核心设备或多核心设备,提供数据链路可靠性;尽量在核心使用冗余的点到点三层互联,因为这种设计可产生最快速、最确定的收敛结果。将核心设计为只使用硬件加速业务的三层交换环境要优于二层的设计,因为在链路或节点故障时能提供更快的收敛速度,通过减少路由邻接关系和网络拓扑提高可扩展性,通过等价多路径提高带宽利用率。

2.安全防护层

安全防护层由局域网核心和广域网接入设备之间的安全防护设备组成,主要功能是提供网络行为审计,流量控制,入侵防护和网络访问控制。组成的设备一般是防火墙,上网行为审计系统,网络流量控制系统,IPS等。该层设备均为串联接入,并且会对数据包进行分析记录,可以采用如下设计提供安全防护层的可靠性:单台设备配备冗余电源提高设备自身供电可靠性;安全设备均需支持双机热备功能;IPS设备具备软硬件bypass功能,反应时间在微秒级;根据网络业务谨慎配置安全设备的策略,并进行全面测试,安全策略的设计会直接影响数据通过安全层的可靠性,因此每个安全设备的安全策略需要进行精心的设计并不断优化,达到既满足安全管理要求,又不会对网络数据产生过大的影响;安全层设备根据局域网核心和广域网接入路由器的配备设计网络拓扑,采用双机热备方式部署可大大提高安全层可靠性。

3.骨干网络层

骨干网络层包括接入路由器和核心路由器,是各类数据快速转发的核心,可以采用以下技术提高可靠性:单个设备配备双引擎,多电源风扇冗余,支持单板热插拔和热补丁技术;支持IGP快速收敛、协议GR/NSR、IP及MPLS快速重路由技术、BFD快速检测技术等;采用双平面结构、多核心的方式组网。

4.新技术和方案的测试试验

提高网络可靠性不仅要细致分析应用需求和业务模式,根据实际业务需求对影响网络可用性影响的关键节点和链路进行合理规划。而且要对关键节点和链路做充分的冗余设计并采用合适的技术手段,同时还要对即将采用的设备和方案进行测试和验证。测试和验证工作需要在一个模拟环境中进行。

以山东省电力学校信息网络技术实验室为例,该实验室建设面积200平方米,配备cisco和H3C实训设备路由器、交换机、防火墙等设备60余台。实训室能够模拟包括一个省中心,5个市公司和1个县公司的系统广域网和局域网环境。实验室配备综合配线系统,能够搭建各种网络拓扑结构。使用模拟网络环境可以进行网络规划设计的技术检测和方案验证,能够进行新设备兼容性测试。为电力广域网的设计、扩容和迁移等业务提供可靠性的检验手段,为在运网络提供可靠性技术支持。

5.一体化运维保障体系

由于电力广域网承载的业务在纵向、横向耦合程度日益加深,总部与网省之间、各个部门之间的相互联系日益增强,电力系统信息化水平已跨入大网络、大系统、大集中、高可靠性和高安全性的“三大两高”时代。

为了标准化信息运维工作,提升信息运维工作的水平,提高信息网络的可靠性,信息系统运行维护工作应坚持“运行与安全”、“建设与应用”并重的原则,通过对信息系统运行维护工作内容进行运维等级划分,确定运维等级划分原则,明确运维工作内容与工作要求,使运维工作要求与运维工作内容等级保持一致。信息运维标准化体系应包括运维体系、费用标准、工作规范、流程标准、运维规程、装备标准、管理制度和考核标准。

通过管理手段实现信息运维标准化的执行与落实,通过技术手段实现信息运维标准化的固化与优化,两者共同促进信息运维标准化的提升,保障信息网络稳定可靠运行。

四、结束语

提高电力广域网可靠性设计的内容非常多,需要从网络分层、模块化、冗余设计、设备选型、特性部署、检测试验、运维保障等多方面统一考虑。随着SG-ERP的推广应用、数据中心化处理不断的发展、云计算普及推广,业务应用会越来越丰富和规范,作为业务承载体的基础网络将被赋予更高可靠性的要求。

参考文献:

[1]于开年.山东国税系统广域网络的可靠性设计[J].济南大学学报(自然科学版),2001,15(4).

[2]刘智勇.电信级以太网的可靠性及实现[J].烽火科技报,2007,(6).

[3]杨静.田生林.贺俊杰.等.华北电力调度数据网网络设计与实施[J].电力科学与工程,2008,(1).

[4]闫光杰.高可靠性广域网络设计思路探讨[J].河北煤炭,2010,(4).

[5]杨国霞,张立岩.计算机广域网网络扩容方案[J].河北工业科技,2010,27(2).

上一篇:金属氧化物与酸反应的实验探究 下一篇:电力系统自动化技术安全管理