浅谈计算机集中监控系统的设计

时间:2022-10-18 06:06:43

浅谈计算机集中监控系统的设计

摘要:计算机集中监控系统主要实现了系统信息采集、信息分析,WEB界面的集中告警、实时告警、历史信息查询、用户权限管理。

关键词:集中监控;分析;监控;告警

中图分类号:TP277 文献标识码:A文章编号:1007-9599 (2011) 12-0000-01

The Design of Computer Centralized Monitoring System

Li Rui

(China Telecom Co.,Ltd.Guangdong Branch,Shantou515000,China)

Abstract:The computer system is mainly to achieve a centralized monitoring system,information collection,information analysis,WEB interface,centralized alarms,real-time alarms,historical information query,the user rights management.

Keywords:Centralized monitoring;Analysis;Monitoring;Alarm

一、系统概述

本系统包括:告警信息采集程序、信息分析程序、集中告警显示、配置程序,服务器采用Dell 6650服务器,本系统部署后对宿主系统影响较小。

二、通过Syslog协议采集系统日志

Unix操作系统和部分网络路由器支持使用Syslogd守护进程写系统日志。利用Syslogd这个功能,在监控服务器上开发一个Syslog消息接收程序,收集被监控设备发来的Syslog消息,解析后将消息内容写入到数据库中。

(一)Syslog消息接收端:采用Java编写,可以迁移到不同操作系统,实现情况如下:监听Syslog网络端口,有消息发来时,将消息读写到缓冲区;启用消息内容处理线程,将消息进行解包、分析、按要求取出规定的内容;启动连接数据库线程,将拆分后的内容写入到数据库表;编写一个图形界面,将接收到消息内容、数量显示出来。

(二)配置Unix操作系统发送Syslog消息:首先,修改操作系统配置文件/etc/syslogd.conf,按要求配置将规定级别的日志消息发送到指定IP(监控服务器)上;然后,重启Syslogd守护进程。

(三)配置Sun T3磁盘阵列发送Syslog消息:首先,修改操作系统配置文件/etc/syslogd.conf,按要求配置将规定级别的日志消息发送到指定IP(监控服务器)上;然后,重启Syslogd守护进程。

(四)配置Cisco路由器发送syslog消息:通过syslog机制,路由器的一些重要信息可以在内部网络的UNIX主机上作日志。日志功能可通过在路由器上设定日志主机的IP地址,并在相应的UNIX主机上作一些必要的设置来实现。在路由器运行的过程中,路由器会向日志主机发送日志。日志包括过滤日志信息、链路建立失败信息等等。

三、通过Shell脚本监控UNIX系统

(一)Shell编程脚本监控方式:Shell脚本是Unix操作系统自身支持的命令语言,又是提供到UNIX操作系统接口的一个编程语言。利用Shell编写脚本,可以在不同操作系统兼容使用,基本占用系统资源。

(二)数据库日志采集脚本:缺省情况下,数据库将其本身产生的日志纪录到一个文本文件中。所以对数据库系统运行情况的监控必须是监控该文本文件的内容。通过分析数据库日志文件,我们可以了解数据库运行是否是健康运行。

(三)操作系统运行状态采集脚本。操作系统运行状态监控包括:磁盘空间、网络连通性、CPU利用率、内存利用率等。用Shell脚本实现,每5分钟在运行一次,生成规定格式的文本文件,发送到监控服务器上,交消息分析程序分析。纪录执行过程到log文件。

(四)关键进程运行状态采集脚本:运行在操作系统上的关键进程,应用系统通过它对外提供业务。监控它的运行状态,能获得应用系统的运行情况。用Shell脚本实现,每5分钟执行一下,获得要监控的关键进程是否存在情况,生成规定格式的文本文件,发送到监控服务器上,交消息分析程序分析。

四、数据库运行状态监控

为了监控数据库的运行状态,我们通过程序采集数据库运行告警日志和获取系统重要的、通用的运行参数来判断是否存在告警,告警的分类通过系统配置表在消息分析程序中分为4类告警,包括:紧急告警、重要告警、一般告警、信息。

(一)数据库告警日志分析:对于Oracle、sybase、informix数据库而言,都有一些运行日志文件保存数据库运行期间出现的告警信息、错误信息,我们通过采集程序将数据库服务器的告警日志发送到信息分析程序,由消息分析程序根据监控系统的配置信息进行分类、保存。

(二)数据库运行状态监控:可分为重要进程监控、数据库空间使用监控、数据库锁、Sybase数据库异常事务监控等。

五、Windows操作系统监控

(一)事件日志:Windows事件日志包含了非常重要的信息,可用于诊断应用和操作系统的故障,测定系统的健康状况并检验系统和应用是否运行正常。

(二)关键进程监控:利用微软脚本中心提供的专用VBS监控脚本,可以检查windows特定进程是否存在,检查情况送消息分析程序分析,如有告警则根据系统配置表对告警进行分类。

(三)磁盘空间监控:通过专用VBS监控脚本,可以获取当前硬盘空间情况,检查情况送消息分析程序分析,如空闲空间过小,达到阀值条件则发出告警。

六、消息分析程序

消息文本是通过SHELL脚本FTP传送到监控服务器上,考虑到分析文件及连接数据库的方便性,分析程序采用POWERBUILDER编写。消息告警的处理是在后台通过SQLSERVER的作业定时分析,把告警分类与消息处理分开是为了避免太多的处理动作造成性能瓶颈。告警信息的显示采用Web方式显示,在系统实现上只需维护web服务器和数据库服务器就好了,部署更新程序方便,不用维护客户端程序。

七、告警配置

告警级别包括有:主机告警级别配置、Oracle数据库告警级别配置、Sybase数据库告警级别配置、Informix数据库告警级别配置,告警配置包括了:

告警显示:包括显示主界面和告警明细界面。

告警方式:监控台告警和短信告警

告警清除:监控人员处理完告警信息后,可选中告警信息,标记为已读、已处理,对于大量告警可通过一次性选中清除。

参考文献:

[1]杨艳,秦森.Oracle数据库自动备份程序的设计与实现[J].电脑知识与技术,2007,22

[2]潘明惠.信息化工程原理与应用[M].北京:清华大学出版社,2004

上一篇:信息时代计算机办公自动化系统在土地管理与城... 下一篇:LIS系统与HIS系统的无缝连接在临床检验中的应...