一次变电站监控系统通信问题分析及处理

时间:2022-09-28 02:33:30

一次变电站监控系统通信问题分析及处理

摘要:本文通过对某220kV变电站监控系统运行现场所发生的不定期通信“死数”问题,进行了细致的故障原因分析,从故障现象入手,剖析了该变电站监控系统间隔层装置和站控层主机的通信机理和双网通信的实现方式,最终定位通信故障问题的原因和双网通信有关,给出了问题的处理方法和验证过程,制定了针对性的反措过程。

关键词:变电站监控系统 通信 死数 问题分析 双网

中图分类号:TM764 文献标识码:A 文章编号:1007-9416(2013)03-0052-02

通信技术是变电站自动化系统的核心技术之一,是变电站自动化系统二次功能实现的重要支撑[1]。随着变电站自动化技术向数字化、智能化方向发展,通信在变电站自动化系统的比重将越来越重要[2]。笔者在长期的现场服务及技术支持工作实践中注意到,变电站自动化系统出现最多的问题就是通讯相关问题。几乎每个变电站自动化系统都出现过通讯中断或通讯干扰问题,有些问题貌似非常“神秘”,时隐时现,问题很难捕捉和准确定位,为变电站及电网的安全稳定运行埋下了隐患。

厦门超高压局对运维的500kV漳州站在3年的运行期间发现的49条通信及自动化方面的缺陷进行了分析,发现最严重的情况是双网络冗余配置的自动化系统A网和B网同时中断,导致测控数据采集丢失,设备失去远程控制[3]。

有文献对一次远动IEC104通道通讯问题进行了分析,通过捕获IEC104通信报文和TCP报文分析,判断出了引起通讯异常的原因[4],另有文献对RCS9000系统常见的通信问题[5]及NSC300总控与35kV保护小室保护装置通信存在通信报文丢包问题进行了分析[6]

本文围绕某220kV变电站监控系统出现的一次通信方面的问题,剖析变电站通信系统的工作机理,定位故障原因,给出解决方案,制定了后续的反措规范,杜绝安全隐患,提高变电站自动化系统的运行可靠性。

1 问题现象描述

某220kV变电站监控系统在2009年5月26日出现了“变中101开关测控信息当地监控后台数据不刷新,而远动系统数据期间正常刷新”的问题,在问题分析期间,2009年7月9日又出现了“变中101开关测控信息远动系统数据不刷新,而当地监控后台数据期间正常刷新”的“神秘”问题,经过厂家工程服务技术人员和调度所专工等的现场分析,发现该站监控系统间隔层全站所有测控装置、后台监控系统、远动装置、交换机等全部工作正常,通过对出现通信故障的“变中101开关”间隔测控装置通信报文的抓包分析,最终清楚了问题原因。总结来说就是“测控装置为A网和B网双网工作,其中B网规约配置信息错误导致”。下面对整个问题分析定位过程进行详细说明。

2 问题分析定位

前述的变电站监控系统采用国内某知名二次设备厂家的系统,该系统采用了先进的设计理念,代表了当今变电站监控的技术发展水平,整个二次监控系统分为站控层、网络层、间隔层,变电站采用工业以太网技术作为站内主干通信网络,间隔层保护测控装置直接具备以太网接口,并以IEC104(考虑到IEC104为远动规约,为在站内传输继保信息,该系统对IEC104进行了ASDU扩展)规约作为站内唯一通信规约,对于220kV及以上变电站自动化系统,重要的间隔二次设备采用双网通信方式[7]。

为便于问题分析,下面给出该220kV变电站监控系统的简化通信组网示意图,如图1所示。

从图1可以看出,该变电站监控系统站控层各功能主站,如当地监控后台、远动系统等采用“对等方式、直采直送”工作,摈弃部分厂家采用的通信前置机模式,符合变电站监控系统技术发展趋势,监控系统和远动系统均采用双主机,双网配置。

7月9日在该变电站自动化系统现场检查发现:当时远动调度端出现间隔“死数”的设备和5月26日的问题设备是同一个设备,为1#变中压侧测控装置FCK 801,其IP地址为A网:10.100.100.23/B网:11.100.100.23,下简称23号FCK测控装置。现场查看结果为当时远动装置和23号FCK测控装置工作于B网,A网处于备用状态,数据报文收发显示正常。现场抓了一帧遥测(ASDU 09)报文内容如下:

[APCI控制字节:6字节] 09 9A 01 00 01 17 01 07 00 58 08 00 00

其中:01 17为装置地址和扇区地址(0x17==23装置地址,01扇区地址)

从上面的报文可知,可能是B网的信息点号基准地址错误。

使用变电站监控系统网关管理工具软件GwManagerNew登陆到该设备后,查询“规约版本”,显示为1,实际应当为2,确认了此版本号设置错误,导致向远动上送的点号和远动数据定义不对应,远动不刷新数据,表现为23号FCK测控装置在远动上“死数”,影响到调度端主站显示。

该监控系统通信网关软件的“规约版本”定义目前分为1和2。设置为1时,信息对象地址(ioa)从0x0701开始编址;设置为2时,信息对象地址从0x4001开始编址,这个设置是为了和早期的网关兼容(早期网关信息对象地址从0x0701开始编址),出现这种设置错误的原因可能有两个:(1)厂内装置下装程序后,漏掉将网关的“规约版本”设置为2;(2)现场工程或其它人员利用GwManagerNew无意进行了改动。

确认此问题后,调度所人员在我公司技术人员指导下现场将 “规约版本”配置定义修改为2,重新抓了通信报文,如下所示:

[APCI控制字节:6字节] 09 9A 01 00 01 17 01 40 00 1C 03 00 00

远动装置本地数据库开始正常刷新,调度端主站也开始正常刷新,问题解决。

此问题和5月26日发生的现象,经分析后,确认为同一个原因。下面给出当时的一个连接示意图和7月9日的连接示意图,5月26日的间隔层装置与站控层监控后台系统及远动装置双网连接情况如图2所示。

7月9日的间隔层装置与站控层监控后台系统及远动装置双网连接情况如图3所示。

5月26日,由于监控系统修改数据库(该信息可以在变电站的工作日志中查询到),重新启动系统,导致系统初始化时选择B网作为工作网,数据开始不再刷新,后来重启了几次主机,直到重新选择了A网为工作网,数据才恢复刷新。整个过程远动系统一直工作于A网,所以数据刷新一直正常。

7月9日,由于某种原因(不详,如果远动机没有重启过的话,应该是网络物理连接回路出现了瞬断等),远动系统工作于B网,数据不再刷新,现场检查当时监控后台23号FCK测控装置工作于A网,所以刷新正常。

问题确定后,调度所人员还检查了全站所有网关是否存在此问题,除了23号FCK测控装置外(已修改正确),未发现其它类似配置错误。

3 问题验证及反措

为进一步证明本次通信故障问题已准确定位,技术人员还在实验室模拟了两种可能导致问题的情况:主机重启,和网络中断,在有23号FCK测控装置配置错误这种情况下,复现了问题,从而进一步验证了问题分析是合理、可以信服的。

通过前面的分析可知,变电站通信方面的问题往往非常隐蔽,在变电站厂内测试验收(FAT)、以及现场投运前的验收(SAT)都很难覆盖到,很多问题在系统在线运行很长时间后才能暴露出来,因此,只有尽量把各种问题触发源都尽量测试覆盖,才能最大限度地消除系统的安全隐患。

针对此次通信系统暴露出的问题,建议监控系统二次设备制造厂家和运行单位应制定反措规程,在涉及到双网通信的时候,一定要缜密细致,把各种可能的组合情况都覆盖测试验证,如工作于A网测试、工作于B网测试、主站手动网络切换测试、装置模拟断网网络切换测试等。

4 结语

通信是变电站自动化系统的重要支撑,随着变电站数字化,智能化的发展趋势,其作用会更加重要,本文通过对一起比较“神秘”的通信故障问题的分析,最终定位了问题原因是和双网冗余配置错误有关,并提出了相应的解决方案和反措规范,为此类问题的分析和防范提供了实用参考。

参考文献

[1]沈国荣,黄健.通信技术是变电站自动化的关键[J].电力系统自动化,2001,5.

[2]李广涛,赵珊珊.变电站综合自动化系统发展综述[J].中国电业,2012,4.

[3]李真.变电站自动化系统常见故障及处理[J].电力自动化设备,2010,8.

[4]陈先勇,时谊,李卫国.一次远动104通道通讯问题的分析与处理[J].计算机光盘软件与应用,2012,16.

[5]时翔,高波,变电站综合自动化设备通信部分异常/故障问题分析及解决措施[J].科技创新导报,2008,7.

[6]段慧娟,李佳,变电站自动化通信报文丢包故障处理[J].电气技术,2011,4.

[7]CBZ-8000变电站自动化系统技术手册.2003.

上一篇:矿用变频器的EMC解决方案 下一篇:自动化生产中的计算机控制技术