浅谈波分系统故障分析与定位

时间:2022-08-17 09:27:06

浅谈波分系统故障分析与定位

摘要:目前波分设备被电信运营商广泛应用于骨干、城域网络,本文从作者多年来对波分系统的维护经验,总结了波分系统故障定位的主要原则和方法,对维护人员的要求,并通过案例分析详细论述了波分系统故障后如何进行分析定位。

关键词:波分、DWDM、定位

中图分类号:U226.8+1 文献标识码:A 文章编号:

一、波分技术的发展背景及优点

随着以IP为代表的数据业务的爆炸增长,以及Internet在全球范围内的迅速发展,网络带宽的需求不断增加。如何提高通信系统的带宽成为焦点问题,波分复用技术(WDM)正是解决这一问题的关键技术,它是将多种不同波长的光波信号,在发送端经合波器把这些光波信号汇合在一起,并耦合到一根光纤中进行传输;在接收端经分波器将各种波长的光波进行分离的技术,由于这种技术具有超大传输容量、节约光纤资源、平滑升级、扩容、超长距离传输、系统的可靠性高等特点,使得近几年得到了迅猛发展。

二、波分故障定位的重要性

最近几年,运营商波分复用(WDM)网络的容量一直在增加,并随着技术的改革,DWDM(密集波分复用)系统的最小波道间隔达到了50GHz,单波容量达到了40Gb/s,正向着单波容量100Gb/s发展。目前运营商干线的实际配置容量已经达到800Gb/s。在这种形式下,如果DWDM系统出现故障,受到影响的业务量往往非常大。如何保证波道的可用性,为业务提供有效的QoS保证,成为DWDM网络维护时必须考虑的首要问题。而故障管理作为网络管理的一个非常重要的组成部分,主要包括: 故障监测、 故障定位、业务恢复、故障修复。在DWDM网络出现故障时,首先要有效的利用备用资源,恢复业务。这就要求先定位发生故障的段落或具体的位置,然后再在此之间调度业务。因此,故障定位是恢复业务的前提,是故障管理中的一个关键环节。

三、波分故障定位的主要原则和分析方法

1、对维护人员的要求

在DWDM网络出现故障时,必须尽快定位故障,以确保故障能够得到及时解决,这对维护人员提出了更高的要求,系统维护员不仅应该熟悉网络拓扑,还应该具备以下几点:

(1)熟悉波分原理,各器件功能。

(2)熟悉信号流、连纤图,波长分配图。

(3)熟悉告警产生的原因和告警信号流产生的原理。

(4)做好设备正常运行时数据的采集与保存。

熟练掌握以上四点能帮助维护员在故障分析判断时思路清晰,定位准确,少走歪路。

2、故障定位的主要原则

故障定位的关键,是将故障点准确的定位到单站。一旦将故障定位到单站后,我们就可以集中精力,通过对性能数据的分析、硬件检查和更换单板等各种手段来排除该站的故障。故障定位的主要原则可归纳为:

(1)先外部、后内部:指应该先排除外部设备的原因,这些外部设备包括电源、光纤、接入设备。

(2)先网络、后网元:指出现故障时,不只是一个单站出现告警,而是多个站点上报告警,要通过分析和判断来缩小导致故障的范围,尽快降故障定位到网元。

(3)先高级、后低级:指在分析告警时要先分析高级告警,如紧急告警、主要告警,再分析低级告警,如次要告警、一般告警。

(4)先多波、后单波:指分析告警时要先处理合波告警,再分析单波告警。

3、故障分析和定位方法

故障定位过程中常用的方法有:信号流分析法;告警、性能分析法;环回法;替换法;仪表测试法,这些方法各有特点。多种故障定位方法结合、可快速定位网络故障。在实际的应用中,维护人员需综合应用各种方法,完成对故障的定位和排除。

(1)信号流分析法 根据业务信号流向逐点排查故障是波分系统中故障定位的常用方法,通过业务信号流的分析,可以较快地定位到故障点。下图是波分系统信号流程图。

(2)告警、性能分析法

通过网管获取的告警和性能信息很全面、详实,在进行告警分析的时候,要遵循“先分析高级别告警,再分析低级别告警”的原则。

(3)环回法

根据业务信号流,逐段环回,定位故障点。

(4)替换法

替换法是当故障定位到单站后怀疑单站内单板或附件有问题时,用一个工作正常的物件去替换被怀疑的工作不正常的物件,可替换物件包括线缆、法兰盘、电源、单板等。

(5)仪表测试法

仪表测试法一般用于排除传输设备外部问题、和其他设备对接问题以及设备性能指标问题,常用的仪表有光功率计,集成于设备上的光谱分析测试单板。

4、波分常见故障分析定位

DWDM系统中常见的影响业务的故障大致可以分为二种:第一种是光缆中断。对于这种故障,我们通过网管可以定位出光缆断点所在段落,再用OTDR监测就可以精确定位断点。第二种是设备故障。例如光放盘故障可能会导致系统中断,分波合波单元的故障可能会造成一个波带甚至整个系统的中断,波长转换单元盘的故障往往影响一个波道。正常情况下,出现这些故障时,网管一般都会上报相关盘的告警,借助网管,就可以准确定位故障。

案例一:如图2,当节点A-D间所有的业务中断时,可能的原因有两个,一是节点A、B、C、D之间的光缆中断,二是节点A、B、C或D的功率放大器、前置放大器等设备出现故障。在这种情况下,应该首先判断是不是设备的故障。如果是设备故障,通过网管上报的告警就可以准确地定位故障。如果网管没有上报设备故障的告警,可以观察同缆中其他系统的运行情况来判断光缆是否中断。如果光缆中所有的系统都中断,我们就可以断定光缆中断了。 对于光缆中断的情形,应该做一个详细的分析。当光缆在节点B和C之间中断时,与断点相邻的两个节点B和C都会出现合路信号丢失告警、OSC信号丢失的告警以及单波道信号丢失的告警。C点收到OSC信号丢失的告警时,C往D方向发送的光功率将会大大降低。光信号在C点到D点传输过程中,由于光纤的衰减,D点收到的光信号可能会很弱,这样D点也会报合波信号丢失的告警。如果业务在节点D直通到节点F,这时E点、F点也有可能会报合波信号丢失的告警,同理,A点也会有合波信号丢失告警。在这种情形下,如果我们单纯关注合路信号丢失的告警,就很难判断出光缆断点是在B和C之间还是在C和D D和E,E和F之间。但是,应该看到,在光缆中断时,节点B和C都会报OSC信号丢失的告警,B向A,C向D发送的业务信号光功率虽然降低了,但是发送的监控通道的光功率并没有下降,因此,节点A、D不会上报OSC信号丢失的告警。在这种情况下,如果把OSC通道的告警和合路信号的告警结合起来,就可以准确判断出光缆中断的段落在节点B和C之间。

案例二:如图2,F点某OTU报线路侧输入光功率过低,这是一条D-F间业务。引起这个故障的原因很多,D、F点的OUT,合波/分波,D、E、F点放大器等设备性能降低,OUT到合/分波器连接光纤,D-E、E-F光缆衰耗增加,这种故障可以用光谱分析仪先排除合波信号光功率有没有降低,再按照信号流,用光功率及逐点测量,就能找出故障点。

四、结束语

故障定位是故障管理的一个重要环节,它是故障修复和业务恢复的基础和前提。在定位DWDM系统的故障时,应该分析故障自身的特点,把不同节点、不同类型的告警结合起来,按照故障定位的原则和方法,找出其中的关键信息,准确定位故障。对于单纯依靠网管上报的告警不能定位的故障,应该借助合适的仪表,测量相关的性能参数,找出故障点。

注:文章内所有公式及图表请以PDF形式查看。

上一篇:娱乐性游泳馆通风量模拟研究 下一篇:分析湿陷性黄土地基的强夯处理技术