浅谈调度交换机突发事件现场处置方法

时间:2022-10-05 09:41:12

浅谈调度交换机突发事件现场处置方法

摘要:为提高应对公司通信系统调度交换机突发事件现场的应急处置能力,正确、有效和快速地处理突发事件,结合调度交换系统的软、硬件特点以及系统布局,阐述了调度交换系统应急处理的流程和规范,具有一定的可操作性。

关键词:调度交换机 应急 突发事件

中图分类号:TM734 文献标识码:A 文章编号:1007-9416(2013)09-0210-02

哈里斯调度交换机作为目前廊坊供电公司调度交换机,其地位和作用相当重要,一旦交换机发生故障,可能会造成调度通信网瘫痪,影响调度命令的上传和下达。冀北地区规定调度交换机故障全停时间超过10分钟为一次障碍,且根据2012年1月1日其施行的《国家电网公司安全事故调查规程》关于因通信业务中断造成的事故的规定相当严格。因此,调度交换系统应对突发事件的现场处置能力好坏直接影响到通信系统的保障率,本文即是对调度交换机突发事件现场处置方案的阐述分析。

1 突发事件特征

调度交换机突发事件是交换机主控系统、功能板、用户板、电源、传输电路、调度台、录音系统等故障,可能导致其承载的调度交换业务中断或受到严重影响的事件。

2 应急组织快速相应,并行使其职责

2.1 启动应急组织机构

根据应急预案的要求,在公司通信系统发生突发事件后,所属通信运行维护单位应迅速成立突发事件现场应急指挥部。突发事件现场应急指挥部下设突发事件现场处置工作组,成员包括通信运行维护单位及设备厂家等通信专业技术人员。

2.2 明确并行使应急组织的职责

2.2.1 突发事件应急指挥部职责

贯彻突发事件应急处置的有关规定,接受上级突发事件处置领导小组下达的应急指令,适时启动和终止突发事件现场处置工作。统一领导通信系统突发事件现场处置工作。

2.2.2 突发事件处置工作组职责

执行现场处置方案中的应急处置措施,接受上级监督检查。根据突发事件紧急程度和通信系统运行情况,迅速、准确地判断突发事件性质及影响范围,并向突发事件现场应急指挥部报告。开展通信系统突发事件现场处置工作,采取有效措施,控制突发事件影响范围进一步扩大。

3 应急处置

3.1 应急处置的原则

突发事件处置按照“先生产,后其他;先上级,后下级;先干线,后支线;先抢通,后修复”的原则,认真执行现场处置方案流程,严格履行工作职责,迅速调动所需通信资源,保障应急指挥通信的畅通,防止发生由于通信原因导致事故影响范围扩大化。同时,要防止引发新的突发事件,保证电力通信系统的正常运行。

3.2 事故预想及应急处理

3.2.1 交换机主控系统故障

(1)故障现象:交换机主控板、矩阵板或总线告警,交换机接续正常。

(2)故障原因:a.主控板故障或者退出服务;b.矩阵板故障;c.总线分配板故障。

(3)故障处理:a.观察主控卡或矩阵卡告警显示灯,查看自诊断程序界面告警情况确定故障板件;b.更换故障板件,若主控板故障,还需进行硬件初始化;c.加载数据并恢复系统;d.通过维护终端将交换机数据库资料进行备份,并拷贝到外置硬盘进行保存。

3.2.2 交换机电源故障

(1)故障现象:交换机全部停电或机框电源板告警。

(2)故障原因:a.直流自动切换模块或者高频开关电源故障;b.机框电源板故障。

(3)故障处理:a.观察机柜内所有板件的指示灯,如果指示灯全灭,判定为外部电源故障。b.直流自动切换模块输入电压正常输出不正常,判定为直流自动切换模块故障,更换直流自动切换模块。c.直流自动切换模块输入电压不正常,判定为高频开关电源故障,通知电源维护专业人员。d.外部电源恢复后,重启系统,自动恢复原有数据。e.机框电源板红色告警灯亮判定为电源板故障,进入管理维护终端的自诊断界面,查看电源告警细节。f.更换故障电源板卡,恢复机框电源的1+1备份状态。

3.2.3 数字(模拟)用户业务故障

(1)故障现象:数字(模拟)话机不能实现正常接续和通话。

(2)故障原因:a.数字(模拟)话机故障;b.数字(模拟)用户线路故障;c.数字(模拟)用户板故障。

(3)故障处理:a.检查数字(模拟)话机接口,重新插拔,如果恢复正常,判定为话机接口故障,重做接口。b.更换数字(模拟)话机,如果恢复正常,判定为数字(模拟)话机故障。c.进入交换机的自诊断程序,检查端口故障现象及告警信息。d.更换数字(模拟)用户板,如果恢复正常,判定为数字(模拟)用户板故障。e.经过以上工作还不能排除故障,在配线架上测试该接口,判断故障段落,逐段检查处理,直至解决问题。

3.2.4 交换机的机框公共板故障

(1)故障现象:交换机双音多频记发器、三方通话、电话会议、广播扩音接口、远端集中维护等部分功能丧失,相关板卡红灯告警,用户接通率变低。

(2)故障原因:a.多功能服务卡故障;b.双音多频记发器卡故障;c.电话会议汇接卡故障。

(3)故障处理:a.用户近期摘机听忙音的概率增高(≥0.01),可判定为多功能服务卡或双音多频记发器卡故障。b.交换机电话会议工作不正常,可判定为电话会议汇接卡或多功能服务卡故障。c.交换机三方通话不正常,可判定多功能服务卡故障。d.交换机远端集中维护功能不正常,可判定多功能服务卡故障。e.交换机广播扩音功能不正常,可判定多功能服务卡故障。f.观察公共板卡告警显示,红色告警灯亮说明该板卡故障。进入管理维护终端的自诊断界面,查看板卡告警细节。g.更换故障板卡。

3.2.5 交换机2M数字中继故障

(1)故障现象:2M数字中继板卡红灯告警,该局向不能正常接续。

(2)故障原因:a.交换机本端2M中继板故障;b.传输系统故障引起的中继电路中断;c.对端交换机设备故障;

(3)故障处理:a.观察2M中继板运行指示灯,红色告警灯亮,说明2M中继故障。进入交换机的自诊断程序,检查该2M端口故障现象及告警信息。b.如果重要2M中断或者多个2M中断,在第一时间通知主管领导。c.在DDF配线架上对告警的2M数字中继接口进行近端和远端环回试验。d.近端还回正常,远端不能正常还回,判定为交换机外部故障,通知传输系统运维人员检查传输系统。e.传输正常,判定为对端设备故障,通知对方交换机维护人员检查对方交换机。f.近端环回不正常,判定为数字中继接口板故障或2M线路故障,更换告警数字中继板或检查2M线路。

3.2.6 调度台触摸屏故障

(1)故障现象:调度台触摸操作不正常。

(2)故障原因:a.触摸屏设备故障;b.调度台主机故障;c.调度台主机软件故障;d.调度台主机与触摸屏之间的连接线缆故障。

(3)故障处理:a.重新启动调度台主机和触摸屏,如恢复正常,判定为软件故障;b.更换触摸屏,如恢复正常,判定为触摸屏故障;c.更换调度台主机,如恢复正常,判定为调度台主机故障;d.如果完成了以上工作,调度台还不能正常工作,判定为连接线缆故障,需要更换触控连接电缆。

3.2.7 调度台话机故障

(1)故障现象:某个调度台单个话机接续、通话不正常。

(2)故障原因:a.调度台话机插头接触不好;b.调度台话机本身故障;c.调度交换机数字用户板故障;d.调度交换机数字用户板至调度台话机之间的连接线缆故障。

(3)故障处理:a.重新插拔数字话机连线,如果恢复正常,判定为水晶头接触不良。b.更换数字话机,如果恢复正常,判定为数字话机故障。c.通过交换机自诊断程序检查端口故障现象及告警类别。d.重新插拔或更换数字用户板,如果恢复正常,判定为数字用户板故障。e.经过以上工作后还不能恢复正常,判定为线路故障,用数字话机在线路上逐段进行测试,判定故障段落,更换相应电缆。

3.2.8 集中录音系统故障

(1)故障现象:集中录音全部停止工作。

(2)故障原因:a.集中录音系统主机设备故障;b.集中录音系统主机上的2M录音板故障;c.系统软件、录音软件或者2M录音板驱动软件故障。

(3)故障处理:a.关机并重新启动集中录音系统,若系统恢复正常,可以判定为软件故障;

b.关机后系统无法启动或启动不正常,可以判定为系统硬件或者软件故障,需要对主机设备进行检查或者重新安装软件;c.系统重启正常,但无法进入应用程序界面,应重新安装应用程序;d.如果依然不能排除故障,更换集中录音板并重新安装应用程序。

3.2.9 分散录音系统故障

(1)故障现象:分散录音系统某一个数字通道告警。

(2)故障原因:a.分散录音主机上录音板的单个端口故障;b.分散录音主机、数字用户板、数字话机之间的连接线路故障;c.数字话机本身故障;d.调度交换机数字用户板故障。

(3)故障处理:a.检查数字话机工作是否正常,如不正常,则处理数字话机故障;b.在录音采集线路上并机测试录音线路是否正常,如不正常,判定为线路故障;c.经过以上工作依然不能正常录音,更换一个录音端口进行测试,如录音恢复正常,判定为录音端口故障。

3.2.10 交换机维护终端故障

(1)故障现象:两台交换机共用一台维护终端,其中一台工作不正常,另一台工作正常。

(2)故障原因:a.维护终端的串口故障。b.维护终端串口与交换机多功能服务卡之间的连接电缆故障。c.调度交换机多功能服务卡故障。

(3)故障处理:a.观察多功能服务卡告警灯,红灯亮判定为多功能服务卡故障,更换多功能服务卡。b.重启维护终端,若恢复正常,判定为串口吊死。c.重启后故障依然存在,交换两个COM口连线,分别检查与交换机的连接情况。d.根据端换前后情况对比,判定串口故障或者是线缆故障,更换相应设备。

3.3 应急处置后期观察

(1)现场应急处置完毕后,现场抢修人员须确认电力通信系统业务电路已恢复至正常运行状态,系统稳定运行30分钟后,可视为故障隐患已彻底排除,方可向通信调度申请结束现场应急处置程序,经批准后方可撤离现场。

(2)通信调度接到结束现场应急处置申请,确认业务电路恢复正常,经突发事件现场应急指挥部同意,方可下达现场撤离命令。

3.4 事件整理汇报

(1)事件报告分为紧急报告和详细报告。紧急报告是指突发事件发生后口头汇报突发事件的简要情况;详细报告是指在完成突发事件处理后,以书面形式提交的全过程报告。

(2)现场处置工作组应在第一时间向上级指挥部报告现场应急响应情况和现场人员、设备受损程度,评估现场应急处置的困难和效率。报告频率:每30分钟一次,若出现重大变化立即汇报。

(3)突发事件现场应急指挥部根据现场处置情况,评估业务迂回和故障排除时间,准确掌握现场处置进度,向上级报告。报告频率:每30分钟一次,出现重大变化立即汇报。

参考文献

[1]《冀北电力有限公司通信调度管理规定》.

[2]《电力安全事故应急处置和调查处理条例》释义.

[3]《冀北电力有限公司突发事件应急处置规定》.

上一篇:校园图书馆管理系统的构建 下一篇:云计算在现阶段图书馆服务中的探讨