DCS数据通讯故障的分析

时间:2022-09-27 11:30:27

DCS数据通讯故障的分析

【摘要】随着化工行业的不断发展,对工业自控系统计算机的要求也越来越高。目前,分散控制系统(DCS)以先进的技术、丰富的控制功能、可靠的工作性能等优势,占据了大、中型化工生产企业及石化行业的主控领域。本人结合多年的工作实践,分析了DCS数据通讯故障,并提出了预防措施。

【关键词】DCS通讯故障预防措施

中图分类号: I253 文献标识码: A 文章编号:

随着化工自动化的发展,DCS 已从较为独立的控制系统发展成同外系统接口联系密切的控制系统,因DCS 网络通信故障, 轻则发生DCS 局部死机,对生产的安全稳定运行带来影响, 重则引起整个DCS 网络通信瘫痪, 全面停车, 甚至影响企业及人员的安全。因此,DCS 系统网络通信故障及其防范便成为目前需要思考和解决的重要问题。

一、DCS系统概述

1、DCS系统产生和发展

1975年至80年代前期为第一代产品。1975 年美国最大的仪表控制公司霍尼韦尔首次向世界推出了它的综合分散控制系统TDC—2000 (Total Distributed Control -2000) , 这一系统的发表, 立即引起美国工业控制界高度评价, 称之为“最鼓舞人心的事件”。世界各国的各大公司也纷纷仿效, 推出了一个又一个集散系统, 从此过程控制进入了集散系统的新时期。

80年代中期至90年代前期为第二代产品。随着计算机的发展与网络开发使各控制厂商更多地采用商业计算机的技术, 80年代末许多公司推出新一代的集散系统, 其主要特征是新系统的局部网络采用MA P 协议; 引用智能变送器与现场总线结构; 在控制软件上引入PLC 的顺序控制与批量控制,使DCS 也具有PLC 的功能。

90年代中期至21世纪初为第三代产品。至90 年代初各国知名的DCS 有: Bailey 的IN F I—90, Rosemount 的RS—3, WestHoose 的WDPF, Leeds & Nonthrup 的MAX—1000,日本横河的CEN TUM。这里所提到的均为大型的DCS, 为了适应市场的需要各厂商也开发了不少中小型的DCS 系统如S—9000,MAX—2, LXL ,A 2 PACS 等等。

目前DCS发展到第四代。第四代DCS的最主要标志是:Information(信息化)和Integration(集成化)。因此,与其说第四代DCS是一套综合的控制系统,更不如说它是一套集成化的综合信息系统。

2、DCS系统特点

DCS 系统具有较高的灵活性与扩展性。具有先进的过程操作画面(动态流程画面。分组回路画面。总貌画面。报警画面。趋势记录画面等), 具有各种控制功能, 运算功能, 并能实现工艺参数趋势预测, 历史数据显示和各种报警功能。从而实现对工艺生产全过程的集中监视、控制和管理。同时 DCS 系统的各种模块能够带电插拔、更换, 这些都是常规仪表所不具备的或需要经过复杂的组合才能实现。

二、DCS数据网络通信故障原因的分析

在DCS 的通信网络上连接有几种不同的节点, 它通常分为两大类。 一类是直接与生产过程通过 I/0 板连接起来的节点, 称之为控制器。另一类节点是与人机相连的, 称为人机界面的另外几种节点, 分别是操作员站、 工程师站、 历史站和动态数据服务器等。

DCS 局部死机表现形式为: 经常出现操作员站死机; 分散处理单元(DPU )的初始化、 死机、 脱网; 冗余控制器(服务器)切换不成功; 数据通信中断等。 除了与应用软件设计是否成熟可靠有关外,还和通信网络堵塞现象的严重程度相关, 主要有以下几种因素:

(1) 由于微软W I NDOW S N T 操作系统本身存在的问题, 以及DCS 应用软件和N T 操作系统在运行中可能发生的冲突, 采用N T 操作系统要比UN IX 操作系统容易发生操作员站、 工程师站死机现象, 特别是键盘操作时几个特殊键按下时, 就会产生死机。在极端工况下, 外部触发因素可利用N T 操作系统的安全漏洞, 引发大量偶发性的报警信息, 导致网络异常。

(2) 当节点连到DCS 的通信网络上时, 通常需有网络接口, 控制器把数据送到接口, 人机界面从网络接口读取数据, 读取数据应遵守网络通信协议。 常用的通信协议为广播式, 网络上的节点把数据送到网络上, 就不断广播数据, 需要数据的节点就接收数据。 除了这种方式之外, 还有一种询问式, 某个节点向网上的其他节点问询数据, 但如果其他节点没有这个数据, 它就反复进行问询, 直至读取到这个数据。那么如果网络上根本没有这个数据, 就会造成网络堵塞。

(3) 在DCS 运行时间比较长的情况下,维护人员不断更替, 控制器的组态也不断变化,但应用软件组态只加不减, 有些组态实际上已没有与真正的 I/ O 点相连。而DPU 读取数据时, 将该DPU 上所有数据点都读进去, 而其中有很大部分的数据是无效的, 因而造成DPU 负荷率过高, 网络堵塞。

(4) 软件升级后, 因硬件驱动程序不匹配, 引发DCS 网络通信堵塞。

(5) 由于M IS (或S IS)系统需要从DCS 中读取生产实时数据, 当网络中接进动态数据服务器时, 网络堵塞现象就变得十分频繁, 从而使得各种人机界面的节点出现死机现象。

( 6) DCS 运行外部环境温度高(如控制间空调、 电源风扇和机柜风扇故障等造成)、 供电电源波动大和切换时间过长也是导致DCS 死机的一个重要原因。

三、防范措施

上述网络异常均涉及到网络通信负荷率高、控制器负荷率高等问题, 由于目前还没有有效的手段在线监测控制器负荷率和网络通信负荷率,找出这类事件的根本原因还有一定的难度, 因此,消除这类缺陷也比较因难。要防止这类事故的发生, 除了必须从源头——DCS 的设计和制造抓起外, 平时加强DCS 系统的网络运行维护显得尤为重要。

(1) DCS 如果采用例外报告的方式, 可将例外报告的区域加大一些, 以减少网络的通信量。 例外报告的意思是现场的某点只在发生变化时把数据送到网络上, 如果不发生变化就不会传送。 但为了防止点已经坏而人机界面不知道的情况, 所以,即使点不变化, 超过一段时间也要报告。 为了减少网络上的数量, 把例外报告的 2 个参数数据都适当加大, 也能达到减少数据量的目的。

(2) 利用机组检修时间逐个复位DCS 系统的DPU 和MM I (操作员站) ; 用工程师站读取控制器中的组态, 删除无效点, 对组态进行优化; 对DCS 进行模件、 机柜、 滤网等的清扫。

(3) 定期检查系统风扇是否工作正常, 风道有无阻塞; 各通信线路连接是否牢固, 检查通信接口是否正常; 定期对各通信模件、 端子进行试验, 保证通信模件的正常工作, 做好机组运行中的设备维护和巡视, 检查通信状态, 防止通信故障; 定期对控制器、 数据总线的负荷率进行在线测试, 其负荷率应满足分散控制系统在线验收测试规程的要求。

(4) 对于DCS 系统和其他系统(比如M IS、S IS 等)的接口, 建议在其他系统侧的网关站上,加装病毒防火墙, 并及时更新病毒库。 同时及时更新操作系统的补丁, 从而提高系统的安全性; 在接入动态数据服务器时, 应检查所有接口的软件版本是否一致。

结束语

随着DCS系统的不断应用和自动化程度的加强,对DCS系统数据网络传输能力以及处理故障的安全性提出更高的要求,这里所讨论的处理DCS数据堵塞故障的一些经验可以为采用同类型设备的工业企业提供参考,促进行业内D CS应用及维护水平得到提高。

参考文献:

[1]栾元迪等. PLC、DCS 及FCS 在中小型冶金生产过程控制系统中的应用[J].自动化博览.2002

[2]赵燕平,火电厂分散控制系统检修运行维护手册,中国电力出版社,2003.

[3]王常力,分布式控制系统的现状与发展,电气时代,2004.

[4]汤文炜,火电厂实时系统建设中控制系统安全性的实现,华中电力,2002.

注:文章内所有公式及图表请用PDF形式查看。

上一篇:建筑外墙保温技术探讨 下一篇:项目管理在工程建筑施工中的应用