关于五号线SCADA系统软件故障的分析总结

时间:2022-05-07 12:25:21

关于五号线SCADA系统软件故障的分析总结

【摘要】:本文通过对五号线电力监控系统(以下称SCADA系统)的软件故障类型及原因进行分析,结合系统硬件性能及配置、软件特点等方面进行研究,分析提出初始化系统软件、更换硬件设备、重新安装及配置软件程序等多个预防措施,最大限度降低软件故障数量,大大提高系统运行稳定性和可靠性,保障运营安全。

【关键词】: SCADA系统、软件故障、预防措施

一、五号线SCADA系统简介

五号线SCADA系统实现对全线车站、车辆段及主变电所供电设备的监视和控制,目前变电所(除主变电所及驻守站点)已实现无人值守,SCADA系统是对现场变电设备的唯一监控手段,对运营安全保障起着重大的作用。

五号线SCADA系统采用集中管理、分散布置的模式,分层、分布式系统结构。系统由所内管理层、网络通信层、间隔设备层组成。系统以供电设备为对象,通过网络将所内的110kV/33kV/0.4kV交流保护测控单元、1500V直流保护测控单元、交直流电源系统监控单元等间隔层设备连接起来,实现对现场供电设备的实时监视和控制。

二、五号线SCADA系统软件故障分析

自2013年3月至2014年6月,五号线SCADA系统设备共发生软件故障30次。其故障表现有监控界面灰屏或假死、供电设备无法远程控制、400V电压等级通讯工况异常等多种形式。

1.软件故障影响

2013年3月至2014年6月,五号线SCADA系统关于400V及1500V电压等级供电设备发生的监控故障次数较多,分别为15次和8次,其次为监控界面灰屏或假死(即全部电压等级供电设备无法监控),为6次,33KV电压等级供电设备监控故障次数为1次。

另外,五号线SCADA系统软件故障并未对正常运营造成影响。目前影响较大的一次故障是2013年9月8日凌晨火车站SCADA系统程序运行出错。由于无法正常下发停电指令,导致当天凌晨火车站比平时推迟半个多钟停电,这对区间作业造成一定程度的影响。

2.软件故障统计分析

2.1 软件故障分布站点及月份统计分析

从表1可以看出,2013年3月至2014年6月,五号线SCADA系统软件故障次数最多的是西场站、科韵路站、淘金站等站点。目前,通过采取各种预防措施,该部分站点SCADA系统软件运行已经趋向稳定,软件故障明显下降。具体如何在日常维护中更好地预防软件故障,将在本论文的第四章进行详细论述。

2.2软件故障原因分析

经过对五号线SCADA系统软件问题进行分析发现,五号线软件故障主要由以下三个原因引起:程序运行出错、总控单元死机及监控软件假死。其中,程序运行出错次数为24次,占五号线软件故障比例为80.0%;总控单元死机次数为3次,占五号线软件故障比例为10.0%;监控软件假死次数为3次,占五号线软件故障比例为10.0%。

三、五号线SCADA系统软件故障处理方法

针对五号线SCADA系统软件问题引起的故障,专业技术人员通过对SCADA系统总控单元的硬件性能及配置、软件运行规律等多个方面进行研究分析,并结合该部分故障的处理方法,最终总结得出,软件故障的主要解决方法是初始化进程,重新建立通信连接关系,以恢复软件正常功能。

四、五号线SCADA系统软件故障预防措施

1初始化系统软件,清理内存及CPU占有率

五号线SCADA操作系统软件为window XP,该系统在安装和使用过程中会产生相当多的垃圾文件。系统运行时间过长时,其产生的垃圾文件占用系统内存,影响系统运行速度,将大大提高软件运行出错的可能性。

五号线SCADA系统的检修周期与计划(小修及以下)分为周检、半年检及年检。由于周检在白天进行,目前OCC不允许在白天初始化系统软件(影响白天行车设备的监控),同时,根据SCADA系统总控单元CPU及内存占有率的浮动规律,结合实际情况,专业技术人员勇于创新,提出在检修计划中添加SCADA系统月检计划,月检的主要任务是对SCADA系统软件进行初始化,及时清理系统内存及CPU占有率,降低软件出错的可能性,减少软件出错次数。

该措施自2013年10月中旬实施以来,五号线SCADA系统软件故障呈下降趋势,至2014年,软件故障次数下降为0。这足以证明,分部专业技术人员勇于创新,提出添加SCADA系统月检计划的预防措施是正确的,具有显著效果的。

2部分站点硬件替换,软件重新安装、配置

五号线科韵路站SCADA系统软件出错的次数较多,均为6次。且经分析发现,科韵路站所报的6次故障均为400V开关通信异常,400V开关通过光纤以太网通信单元、间隔层交换机后接入SCADA系统总控单元,此六次故障的解决办法均是对光纤以太网通信单元进行初始化,初始化后软件功能恢复正常。事后,分部专业技术人员对此六次故障进行深入分析,怀疑是软件通信不稳定引起。软件通信不稳定与硬件存在一定关系,如硬件内部接线较松,或软件与硬件不兼容,其表现出来的故障现象属于软件故障,经初始化进程后可以解决,但实质却是硬件问题,每隔一段时间会反复报故障。发现这一点后,专业技术人员决定对科韵路站的光纤以太网通信单元进行硬件更换,并重新安装软件及配置。自采取此措施以后,科韵路SCADA系统并未再报类似故障。

五号线西场站与科韵路站一样,发生的软件故障次数为6次。通过采取同样措施,目前西场站SCADA系统也并未再报软件故障。

五、五号线SCADA系统软件故障分析总结

综上所述,五号线SCADA系统软件故障原因主要有程序运行出错、总控单元死机及监控软件假死等三个方面,其故障影响范围也各有不同,主要表现为400V电压等级供电设备通讯工况异常、1500V电压等级供电设备无法监控,系统监控界面灰屏或假死等多种形式。

软件故障的主要预防措施为初始化系统软件,清理内存及CPU占有率。此措施主要目的是确保系统运行的流畅性,避免因系统运行卡顿而引起故障;此外,对发生软件故障的站点进行故障次数统计,并观察故障表现形式,若是多次故障均为同一故障类型,则需考虑是否为软件与硬件不兼容问题引起,这个时候,可以选择更换硬件设备,并重新安装软件及配置,并重点观察此站点SCADA系统运行状况,方便采取下一步计划;最后,针对变电人员检修作业后,变电设备与SCADA系统无法通信的状况,则需关注变电作业情况,提前与变电人员沟通,在作业后对SCADA系统与变电设备的通信状况进行测试,方便及时发现问题,并尽快解决。

目前,通过采取预防措施,目前SCADA系统软件故障大幅下降,这可充分说明预防措施是正确的、且预防效果明显。我们也将继续深入研究分析SCADA系统,研究系统的运行规律,加强对系统技术原理的认识,在日常检修中加强维护,尽最大的努力减少系统故障次数,确保系统设备正常稳定地运行。

上一篇:低压电气设备接地技术措施的论述 下一篇:转换层技术在房屋建筑工程施工中的探讨