网络设备缺陷管理方法初探

时间:2022-03-26 01:24:45

网络设备缺陷管理方法初探

【 摘 要 】 随着计算机网络应用领域的不断拓展,其应用领域已经从传统的单机、小范围网络的资源共享,发展到中、大型业务应用系统。大型网络系统业务的应用,在提高工作效率,带给人们便利的同时,也使系统安全和信息安全面临巨大挑战。信息安全的软件方面,除病毒、黑客攻击、操作系统漏洞等威胁外,网络设备缺陷造成的系统硬件故障,更是一个不容忽视的重要因素。

设备缺陷导致的系统故障,轻则造成系统停机、数据错误;重则造成整个系统崩塌、数据损毁甚至全部丢失。因此,对相关设备的日常管理就成为保证网络系统正常、安全运行的重要手段。笔者结合多年从事网络规划与管理的实践经验,对计算机网络设备的缺陷管理进行了一些拓展探索,获得了一些体会。

【 关键词 】 计算机网络;设备缺陷;缺陷定级;维护;报废

1 网络设备定级

对网络设备定级,可以加强对重点设备的监督,做好设备的运行监视和检修维护。单台设备完好率,是保证整个计算机网络系统正常运行以及衡量网络管理好坏的重要考核指标之一。

网络设备定级,主要是根据设备在运行、维护和检修中发现的缺陷,并结合试验和校验的结果,从理论原理上和实际运行状态进行综合分析,探测其对网络安全运行的影响程度以及设备技术管理状况来评定设备的等级。根据评级标准,可以将设备分为三类。

1.1 一类设备

设备性能、技术状况全面良好,各项主要指标和次要指标完全符合该设备的设计要求,外观完好整洁,技术资料齐全、正确;能保证计算机网络正常、安全、经济运行的设备。

1.2 二类设备

设备主要部件和主要技术指标合格,技术资料基本完整,外观尚可,但个别次要部件或次要试验、检测结果基本合格,但存在某种瑕疵,次要技术指标存在有一定负偏差,但尚不致影响安全运行或仅有较小影响。

1.3 三类设备

设备有重大缺陷,主要技术指标与设计不符,外观很较为破旧,主要技术资料残缺不全,不能保证安全运行;设备各项技术指标和档次已经远远滞后于计算机最新技术发展水平且无法升级者,相关管理制度规定的预防重大事故措施项目未完成者。

2 网络设备缺陷定级

根据设备缺陷对安全运行威胁的程度,缺陷类型分四种:

2.1 一类缺陷

根据日常运行表象和理论分析后认为,对安全运行有严重威胁,短期内可能导致严重运行故障甚至局部系统崩塌,或一旦发生故障,其后果极为严重,必须迅速申请检修或停机做大修处理的缺陷。

2.2 二类缺陷

指对安全运行有一定的威胁,经理论分析和实际检测后认为,短期内尚不至于导致较大故障,但必须在正常停机后处理的缺陷。对这类缺陷,应在正常巡视监测中加强检查和监视,防止缺陷升级。

2.3 三类缺陷

设备存在一定问题,经理论分析和实际检测后认为对安全运行威胁较小,在较长时期内不会导致事故,可以在月(年)度大修或改进工程中结合消除的缺陷。

2.4 四类缺陷

设备的主要技术指标已不能满足安全运行要求,或已属淘汰产品,或者设备存在的薄弱环节由于材料设备、技术水平的限制,在较长时期内难以解决的“老大难”问题。这类缺陷必须结合基础建设做报废处理,或通过更新、升级改造工程来解决。

3 缺陷网络设备检修

发现网络设备存在缺陷应及时进行检修,防止缺陷扩大而发生事故。为保证网络系统的运行安全,应定期对网络设备进行试验检查和检修。

网络设备检修工作分为两种,即计划检修和非计划检修。

根据网络设备的在整个系统中的性质、功能和地位制定不同的检修计划,计划中明确不同设备的检修周期,不同网络设备,执行不同的计划检修周期,实行“到期必修,修必修好”的原则。

非计划检修是由于某种原因造成设备突发性故障或损坏而抢修设备,所以非计划检修又叫事故抢修,在非计划检修中,还包括设备使用过程中的一般故障的及时处理和维护。

设备的计划检修一般又分为日常维护、小修和大修三种。

3.1 日常维护

日常维护是指,系统在正常运行期间并未发生故障,维护人员根据日常维护周期和项目,例行对系统设备进行的一般巡视、检查和保养,或当系统设备发生故障后,能够现场处理并在短时间内恢复其额定功能和相关技术指标要求,能立即投入使用的修理和维护。此类维护和维修,一般不更换零部件。

3.2 小修

小修是指不能由一般维护人员完成,必须将缺陷设备送往专业技术人员或部门处进行的,工作量较小的局部修理。此类维修周期一般不超过一周。小修内容,一般是零部件检修和更换不合格的零部件等。通过小修恢复设备的额定功能和其它技术性能指标。

3.3 大修

大修是指工作量最大的一种检修,它需要由专业的技术人员或技术部门,将缺陷设备大部或全部拆卸检查、试验、校验;更换和修复零部件。通过大修,使设备恢复额定功能、技术性能指标和运行效率。

4 网络设备的运行维护

网络设备在运行中,应由专业运行维护人员,经常观察并掌握其运行参数,分析设备的运行的状况,并不断对发现的问题进行处理,对网络设备的操作必须正确。为此,应建立运维制度。

4.1 值班制度

较大型的网络系统一般都是24小时连续不间断运行,因此,对运行中的网络设备应设有专人或兼职人员进行值班,其职责是监视网络设备的运行状态和运行参数,如电压、电流、温度、湿度、声音、运行日志等,使其在设计规定的条件下运行。当发现有不合乎正常运行的状态和情况时,应及时采取措施,做好值班记录并上报相关职能部门,防止故障扩大。

4.2 运行记录和日常维护记录制度

运行中的值班人员应根据相关值班制度的规定,定时按规定将有关运行参数和发生的变化及时间正确记录下来,在正常情况下作为分析、判断设备健康状况的依据,在发生事故后作为追踪事故源头,分析事故原因、事故等级和处理事故的重要依据。

4.3 运行分工负责制

运行中的网络设备,要根据其性能、在系统中的作用和地位以及复杂程度分为若干单元,按值班人员的技术职能和技术等级,分工负责观测和检查。

同时,要建立专门机构,整理、分析运行资料,掌握设备运行状况,并及时提出改进措施。

根据网络设备功能不同,技术要求的复杂程度,制定现场安全操作规程、运行规程和各种保证安全的规章制度,并经常组织操作人员、维护人员、专业维修人员不断学习计算机技术,努力提高他们的计算机技术水平,提高操作人员的操作水平,防止发生误操作,从而导致设备故障。

5 设备安全措施

为保证网络设备安全运行,每年应根据季节特点,组织人员进行专项检查,以便及时发现事故隐患,防止事故发生。

每年在雷雨季节到来之前,组织防雷检查,重点检查防雷设施、接地装置、设备绝缘状况。

夏季到来之前应进行降温、防风、防雨、防汛、除湿等检查。重点检查设备是否过载,湿度、温升情况,通风装置是否良好,导线等有无缺陷。

防小动物的检查。要经常检查防止小动物入侵的措施完好。

参考文献

[1] 唐凯军. 电脑应用疑难问题与技巧1000[M] 四川电子音像出版社, 2002.

[2] ,郑连清. 基于网络的校区视频监控设计与实现[J] 重庆理工大学学报:自然科学版,2011.

[3] 吴阶林, 变电站设备检修管理系统探讨[J] 湖北电力,2002.24—27.

[4] 黄华军,王耀钧,姜丽清. 网络钓鱼防御技术研究[J].信息网络安全,2012,(04):30-35.

[5] 方欣,万扬,文霞等. 基于协议分析技术的网络入侵检测系统中DDoS攻击的方法研究[J].信息网络安全,2012,(04):36-38.

作者简介:

唐凯军(1964-),男,四川人,大学,工程师、高级程序员,四川卫生康复职业学院教师,主要讲授大学 “物理”、“电子电路”、“电工原理”、“计算机”等课程。研究方向:校园信息化、数字化应用。

上一篇:基于状态的应用监控与恢复算法与模型 下一篇:虚拟现实技术在教学中的应用