智能网络运维监控系统

时间:2022-03-22 10:44:51

智能网络运维监控系统

摘要: 在信息化建设不断加速的背景下,网络设备越来越多,但是缺乏必要自动化监控的手段,很难全面及时地掌握各业务系统的运行状态,运维管理采取传统被动管理模式,信息化的成员工作比较被动,只有在事件发生后,并已经造成业务影响时才能发现和着手处理。为了保证计算机网络系统安全可靠工作,对计算机网络系统进行自动监视和有机管理。该文介绍了采用ICMP协议及SNMP协议实现了对网络上设备的监控系统,并着重对网络监控系统的实现提出了编程思路和解决方法。

关键词:SNMP(简单网络管理协议);ICMP(PING)协议;网络设备监测

中图分类号:TP393 文献标识码:A 文章编号:1009-3044(2013)19-4403-04

近年来,在局和台统一部署和努力下,我台的信息化建设取得了可喜的成绩。随着我台信息化技术不断发展,自动化规模越来越大,各类业务系统的应用,对网络运行的稳定性和可靠性提出了更高的要求。网络系统设备是实现发射机自动化重要的信息基础设施,我台网络由于业务特点,决定了其网络是分布式的,点多面广,结构复杂,分支网络在地理上分散于两个台区的多个机房内。用人工的方式去查看网络系统中各个设备的运行参数,不仅费时费力,而且难以全面及时地掌握各业务系统的业务状况。

目前比较流行的网络管理软件有IBM公司的Net View,HP公司的Open View,以及Cisco公司的Cisco Works等。但这些软件以管理主干路由器为主,或者是建立在独立厂商各自设备的基础之上,对于我台网络结构并不能完全适用。而网络设备正常运行与否,直接关系到发射机的播出情况,进一步导致不良的政治后果。为了解决目前的困难,实现一个高效的、实时的、智能的、合适的网络设备监控系统,已经被提到了一个空前的高度上。

因此,我台计划建设信息化IT运维管理平台,实现对网络系统、服务器、数据库、机房环境等信息基础的设施的全程自动监控;改变以往被动的、孤立的、分散的管理模式,主动及全面发现系统中存在的问题[1],以流程贯穿整个运维管理过程;减少运维人员的劳动强度,提高效率,切实保障各业务系统可靠、稳定、高效的运行,进一步信息化为全台的服务质量。

1 基于ICMP和SNMP协议网络运维系统设计

ICMP是(Internet Control Message Protocol)Internet控制报文协议。它是TCP/IP协议族的一个子协议,用于在IP主机、路由器之间传递控制消息。控制消息是指网络通不通、主机是否可达、路由是否可用等网络本身的消息[2]。本系统正是利用了“是否可达”功能来检测目标主机是否处于联网状态。

SNMP,Simple Network Management Protocol,即简单网络管理协议[3],是有IETF定义的一套基于SGMP(简单网关监视协议)的网络管理协议。在SNMP为技术的网络管理系统中,管理工作站利用SNMP进行远程监控管理网络上的所有支持这种协议的设备:如计算机工作站、终端、路由器、Hub、网络打印机等,主要负责监视设备状态、修改设备配置、接受事件警告等。本系统正是利用了这些功能,对网络中的设备进行各设备状态的实时监视。

本次系统开发,结合我台实际应用,采用SNMP及ICMP(PING)两种方式,实时采集网络中设备的相关数据,比对预设阈值,进行告警管理,并实时保存数据等功能。由于两种协议都会一定程度上增加网络带宽,所以系统在设计之初就提出了时间间隔的概念,即两次执行PING和SNMP的时间间隔。

本系统的ICMP协议采用了PING方式实现。管理主机向目标主机执行一次PING命令时,在预设的时间内没有完成本次PING,则系统会认为管理主机与目标主机之间的链路出现了问题,将会产生语音、文字及图像报警信息,通知维护人员前往处理故障。表若PING成功,表示目标主机可达,即主机处于正常联网状态,系统将继续执行SNMP协议相关功能。

SNMP协议在PING成功后执行,获取相应设备的参数信息,与预先设置的阈值进行比对,若超出阈值,同样的会生成语音、文字及图像的报警信息来通知维护人员。两种协议实现流程如图1所示。

2 网络运维系统结构和功能

建立网络设备监测系统[4],实现传统的被动式故障处理方式向前瞻式管理方式的转变,既要使网络中出现的危险和漏洞降到最低,防范于未然;又要减轻我台面临着巨大的运维压力,降低信息管理的难度。因此,整个系统以事件为核心,将IT资源监控管理系统与流程管理系统有机地整合在一起。采用统一事件管理系统,对整个系统内的所有事件进行收集、关联分析和处理。

通过统一的管理系统对管辖范围内IT对象的运行状况和系统性能进行实时的监控,并以类visio图形化的方式直观地展现出来。对于系统运行的异常表现及时采用文字、图形及语音的方式报警。

本网络运维系统主要是应对我台现有的网络设备,而我台需要监测对象有:服务器、交换机、路由器、防火墙、存储设备、终端主机、UPS等终端,所以此次系统设计也主要针对这此设备展开。根据我台维护人员历来的经验,在故障处理过程中,主要针对设备 ICMP (PING)延迟,内存利用率,硬盘利用率,CPU利用率,网口流量,设备持续运行时间,会话数,电压状态等参数信息判断网络运行情况,所以软件功能也由此展开。图2显示出了本系统的主要监测对象及功能:

图2

3 软件系统设计与实现

网络运维系统软件采用了微软visual stdio 2010开发平台,使用WinSNMP API实现SNMP协议[5]及ACE网络库实现ICMP(PING)协议,并结合人交互较好的ribbon控件(图3,图4)及类visio控件(图5)进行开发。现简单介绍此系统的几个功能:

上一篇:大洋硬盘播出系统的应用 下一篇:基于MESH网络的燃气报警机制研究