电力数据通信网网络设备故障分析

时间:2022-06-04 08:43:57

电力数据通信网网络设备故障分析

摘要:通过分析电力数据通信网的常见故障,研究并总结出了一套高效的故障排查及解决方法。该方法按照网络设备的组网层次分别从内部路由协议、外部路由协议、标签转换协议方面入手,分别进行说明,适用于目前使用较为广泛的思科和华为厂家生产的高端路由器。

关键词:数据网;标签转换;故障处理

引言

电力数据通信网是支撑公司信息、管理、监控等业务稳定运行的综合型网络平台,是保障电力安全生产的重要辅助工具。S公司电力数据通信网自投入运行以来就采用全网网络侧边缘设备PE(provideredge)的结构,组网设备涉及思科、华为、华三等多个品牌,其上承载了近20种不同的业务,具有覆盖范围广、网络结构复杂、业务种类多的特点。下面将以该公司所在省典型的网络架构为基础,从内部路由协议、外部路由协议等方面分别阐述相关的故障与处理。

1故障处理一般流程

数据通信网逻辑结构由上到下一般为多标签转发MPLS(multi-protocollabelswitching)邻居、边界网关协议BGP(bordergatewayprotocol)邻居、内部网关协议IGP(internalgatewayprotocol)邻居、点对点协议PPP(pointtopointprotocol)邻居,产生故障的影响关系与之相反,分别为PPP故障影响IGP、BGP和MPLS邻居关系的建立,IGP故障影响BGP和MPLS邻居关系的建立,BGP故障影响MPLS邻居关系的建立[1]。另外,结合各层逻辑结构不同的难易程度,故障查找与处理一般遵循先内后外的顺序。

2IGP常见故障及处理方法

内部路由协议是运行在物理层链路层之上,实现小区域范围网络设备互联互通的功能。目前省内IGP仅采用中间系统到中间系统IS-IS(intermediatesystemtointermediatesystem)和开放式最短路径优先OSPF(openshortestpathfirst)2种协议实现域内的互联与互通。另外,由于BGP邻居关系是建立在传输控制协议面向连接的TCP(transmissioncontrolprotocol)之上的,也就是说如果要建立BGP邻居关系,如果两个连接没有实际的物理链路,就需要IGP来提供路由[2],因此必须先确认IGP路由是否正确。

2.1IS-IS常见故障及处理方法

IS-IS故障按照部署位置可以划分为接口故障和协议故障两个部分,排查故障按照从协议到接口的顺序层层深入,具体步骤如下。2.1.1查看IS-IS路由表信息排查IS-IS故障,首先需要查看对应的路由表信息,如图1所示。对核心P2操作后发现没有相应的路由条目,此类问题多为全局下的IS-IS协议存在问题,此问题多为全局配置模式下,没有正确的指定IS-IS层次或ISIS协议地址存在问题。需要检查并配置正确的网络层次,本例中骨干区域内全部为level-2,因此在全局模式及接口下均需要指定对应的层次类型。正确的配置如图2所示。2.1.2查看接口下配置信息对于指定设备,如图3所示,可以指定设备的环回地址查看路由信息,确认与该设备是否建立了邻居关系。此处需要注意的是目前IS-IS仅支持点到点网络和广播网络,正确的接口配置如图4所示。

2.2OSPF常见故障及处理方法

OSPF故障按照部署位置也可以划分为接口故障和协议故障,同IS-IS,按照从全局协议到局部接口的顺序排查,具体步骤如下。2.2.1查看OSPF路由表信息OSPF路由表中能够看到除直连以外的OSPF路由信息,如图5所示,其中包含更新源接口,建立时间等内容,如果存在单独的路由条目状态为LOADING,则需要查找相应的宣告地址是否正确,接口配置是否正确。2.2.2查看接口下配置信息为缩短OSPF协议收敛时间,本例中指定参与OSPF组织的设备接口类型统一为点对点,如图6所示,另外对于环回地址和互联地址,只宣告相应的网段,精确路由条目。OSPF通过互相交换链路状态计算路径,因此需要合理的划分区域,降低OSPF计复杂程度,缩短路由收敛时间。正确的OSPF配置如图7所示。

3BGP常见故障及处理方法

本例中64600域与19746域采用背靠背方式进行对接,所有路由器都运行MPLS协议,都需要与各自的核心路由器建立BGP-vpnv4邻居传递业务路由。因此首先要确认故障路由器是否与核心路由器间建立了稳定的BGP邻居关系,其次是确认域内能否正常互访,最后排查跨域的互通。BGP协议主要维护3张表[3],因此相关的故障与处理也都基于这3张表完成,分别为邻居表、转发表和路由表,对应如图8所示的命令。如邻居表中的数据发生异常,则直接查看异常路由器的BGP配置、IGP邻居等是否正常;如转发表中的数据发生异常,则需要确定该路由没有最优的原因,多为管理距离值异常导致[4]。为保障多业务间的逻辑隔离,需要引入MPLS-VPN进行组网,对于站端PE来说,每一个业务都维护各自独立的路由表。排查BGP故障,重点查看BGP-vpnv4是否正确建立,图9所示分别为正确的邻居关系及错误的邻居关系。如果邻居关系错误,则首先需要确定IGP路由表中是否存在正确的路由信息,或者通过PING的方式确定该设备环回地址的状态是否正常,如果不正常需要查看OSPF或ISIS路由状态;如果正常则需要查看BGP配置,在BGP下,首先要启用全局BGP邻居,默认只会启用BGP-ipv4邻居,在公司的应用场景中,需要启用BGP-vpnv4邻居来传递业务路由。因此需要查看BGP-vpnv4路由表,确定是否存在正常的BGP-vpnv4邻居[5]。

4MPLS邻居关系

BGP-vpnv4邻居建立起来后,需要启用业务路由转发实例VRF(virtualroutingforwarding)。通过给不同的业务路由添加标签进行路由转发,通过命令shmplsldpneighbor来查看与该设备建立邻居关系的路由器是否正确。如果不正确则需要查看全局下、接口下是否都启用了MPLS,全局下的MPLS邻居类别要相同,本例中全部采用LDP类型。在MPLS邻居关系建立正常的基础上,需要针对不同的业务启用相应的VRF实例,并配置独立的路由标识RD(route-distinguisher)号,最后将相应的接口在BGP中进行重分布。

5结束语

公司数据通信网路由器的稳定运行是各类业务正常动作的基础,电力数据通信网PE设备故障分析与处理从路由协议的角度出发,介绍了近些年运行维护过程中发生的典型故障及相应的处理方法,以上处理方法已经在实际运行环境中得到了多次验证,在故障定位、解决方面取得了良好的效果。

作者:谷良 孟亚宁 单位:国网山西省电力公司信通公司

上一篇:数据通信网改造技术的方案 下一篇:数据通信电源和高压直流供电新系统分析