Nagios网管软件在安徽地震监测网络中的应用

时间:2022-07-19 11:42:33

Nagios网管软件在安徽地震监测网络中的应用

【摘 要】“十五”期间,安徽省地震局全面贯彻“以信息化带动工业化,以工业化促进信息化”的发展战略,计算机网络大大普及,如何有一个稳定可靠的网络环境就成为信息时代中最重要的问题之一。Nagios 是一个运行于 Linux 系统上的开源网络管理监测系统,通过它可以实现对区域内各网络设备、仪器与服务的集中监控。通过监视和控制这些设备,及时地向管理人员报告网络状态,并且简化网络故障的处理,减少故障造成的损失,提高网络的服务质量和效率。

【关键词】地震监测网络;开源网管系统;监控;Nagios;报警

【Abstract】“Fifteen” period, Earthquake Administration of AnHui to fully implement the “drive industrialization with information, promote information with industrialization”development strategy, computer network greatly popular, how to have a stable and reliable network environment has become one of the most important problems in the information age. Nagios is an open source network management and monitoring system of a run on the Linux system, which can realize centralized monitoring of the network equipment, instruments and services. By monitoring and controlling the equipment, timely report to the management of network state, and simplify handling of network fault, reducing the loss caused by fault, improve the quality and efficiency of service network.

【Key words】Earthquake monitoring network; Open source systems; Monitoring; Nagios; Alarm

0 引言

2010年安徽地震局在“十五”“中国数字地震观测网络”项目的基础上,通过新建“安徽省地震监测与应急指挥中心技术系统”,完善了安徽省地震专业信息化基础设施平台。该系统覆盖测震、强震、前兆、GPS、地震应急、信息服务、政务办公、专业地震台站、区县地震办公室等区域,成为安徽省地震监测的基础网络系统。

为了管理好这个综合网络系统,2011年我们以Nagios开源软件为基础,通过集成开发,搭建了高效、可靠、易用并具备良好开发接口的网络监控系统实现全网综合监控,解决了常规网管软件在系统运行维护中所遇到的难点问题,现已应用于全网的运行管理之中。本文就此监控系统的组建与开况做一介绍。

1 Nagios 系统

1.1 Nagios 系统介绍

Nagios是一个用来监视系统和网络的开源应用软件,它通常运行于一个主服务器上,这个服务器运行 Liunx 或 Unix 操作系统。Nagios 利用其众多的插件实现对本机和远端服务的监控,当被监控对象出现异常,Nagios 就会及时给管理人员告警。它是一个基于 TCP/IP协议的软件包,包含有Nagios主程序和它的各个插件,配置非常灵活,可以监视的项目很多,也可以通过自定义 shell 脚本进行监控服务,非常适合各类企业的网络应用。

1.2 Nagios 系统的主要特点

Nagios 系统的特点主要有下面几点:

(1)监控主机资源和网络服务;

(2)允许用户通过设计实现简单的插件来监控自己特定的服务;

(3)当被监控对象出现问题时,会及时通知管理人员;

(4)事先定义事件处理程序,当对象出现问题时自动调用对应的处理程序;

(5)通过 web 页面来监视对象状态,警告提示和日志文件。

1.3 Nagios系统的目标

网管软件,其本质是运维支持系统,也可称为行为支持系统,即通过此工具来支持行为,提高行为工作效率。

网管软件作为有效的网络运维工具,当其部署于整个网络系统,作为网络运转的一个有效组成部分,并形成完善的信息采集、输入、输出等体系时,就成为真正意义上的网管系统。网管系统可以帮助运维人员提高工作效率,保障网络7X24持续、稳定运行。可以从以下三个方面来理解:

1)网络监管自动化;

2)复杂工作简单化;

3)工作流程标准化。

2 Nagios系统安装

2.1 安装环境准备

本文的nagios系统部署在一台服务器中,为曙光A620r-F4,Intel cpu,1G内存,2个10/100/1000Mb自适应网络接口,73G硬盘。操作系统为Suse Enterprise Server 10 with SP2,同时系统中安装有Apache2、PHP5、Mysql5、c/c++ development libraries、Gd库和Oracle组件等程序。默认语言为English,同时支持安装简体中文。IP地址为10.34.0.23。

2.2 Nagios系统结构部署

Nagios在开源网管系统中被定义为一个企业的监控软件,可以对各类主机、设备、服务等进行详细监控,具备丰富的扩展功能,目前可用于Nagios的扩展插件有上千种。本系统中用到的开源软件和扩展插件包括:Nagios-plugin、NDOUtils、NRPE和NSClient+ +。

2.3 Nagios系统服务器端安装顺序及效果展示

(1)Nagios系统

(2)Nagios-Plugin

(3)NDOUtils安装

NDOUtils是一个可以把全部状态信息保存到MySQL数据库里的外部构件。另外Nagios的库实例都可以把它们监控的信息保存到统一的中心数据库并集中报告。它将为一个Nagios新的基于PHH的WEB接口程序提供数据源服务。

(4)NRPE安装

NRPE是Nagios的一个扩展,它被用于被监控的服务器上,向Nagios监控平台提供该服务器的一些本地的情况。例如,cpu负载、内存使用、硬盘使用等等。NRPE可以称为Nagios的for linux 客户端。安装分为客户端与服务器端,NRPE端口号:5666。

(5)NSClient++安装

NSClient++ 是 Nagios 监控系统在 Windows 下的客户端软件,可以实现对设备是Windows系统的内存、CPU、用户数、进程等的监控。NSClient++端口号:12489。

3 Nagios系统的配置和应用

3.1 配置管理工作

(1)以文件形式进行配置文件管理

包括系统配置文件、命令配置文件、监控对象配置文件等。

(2)目前不具备良好的自动检测功能

配置工作需要手工完成,前期工作量大,任务繁琐。

(3)nagios有配置检测命令,可进行配置检测,减少系统出错

3.2 配置分类

目前的Nagios系统中配置与定义工作需要手工完成。本文中将各类被监控的设备、服务等统称为“对象”。

(1)对象监控模板

本文安装的系统主要定义了主机设备模板(generic-host)、系统服务模板(generic-service)、联系人模板(generic-contact)三类对象模板,存放在/usr/local/nagios/etc/objects/templates.cfg文件中,它们定义了相关对象的参数。

(2)监控对象分组

Nagios可以按部门分组、按服务分组和按设备类型分组。

4 二次开发实现web声音报警

与监控系统相关的是故障报警系统,在Nagios中,已经提供了web界面报警、邮件报警和语音报警三个功能,本文将主要介绍利用火狐浏览器进行声音报警。

首先下载安装火狐浏览器,之后进入火狐安装插件,地址:https:///zh-CN/firefox/addon/nagios-checker/?src=search

在浏览器的右下角会显示安装后在浏览器右下角有“N”字样,点开进设置

输入相关的名称,以及nagios用户名密码,状态信息管理。

设置完成后只要打开火狐浏览器就能听到声音报警。

5 总结

本文详细介绍了Nagios网管软件在安徽地震监测网络中的应用,实现了基于B/S结构的网络管理方式,对我局所管辖的各类IP设备、仪器与服务运行监控管理工作提供了帮助,实现了故障页面声音报警的功能,为故障的及时排除提供了宝贵的时间,将设备的服务中断时间降至最低,从而为网络的正常运行提供了良好的保障。

在这几年的使用中,系统先后为信息网络、强震台网提供了全面的仪器、网络服务情况监控,为信息中心的网络运维工作提供了重要的重要的监控手段。

【参考文献】

[1]吴娜,鲁东明.网络管理技术的研究与发展[J].计算机应用研究,2000(04):7-10.

[2]宋磊,王静文.OpenBSD下基于Nagios的网络服务监控报警系统的研究[J].电脑编程技巧与维护,2009(14):112-113.

[3]Nagios 项目组.Nagios-3 应用指南[S].http://, 2007.

[4]郑黎辉,黄宏生,王启东,等.网络故障短信报警在地震信息网络中的实现与应用[J].华南地震,2009,29(2):124-129.

[5]李刚,周利霞,王晓磊,等.高速区域网络环境中的网站负载均衡系统[J].西北地震学报,2009,31(3):296-301.

[6]李晨光.Linux系统网络管理模块的实现[J].铁路计算机应用,2008(17):35-37.

[7]何辉,权晓红,石全民,等.自主设计网管系统:开源软件以及自由软件应用于网络管理方案[J].中国教育网络,2009(6):42-47.

上一篇:从苏丹上阿特巴拉防渗墙施工看企业理念差异 下一篇:磁传动化工泵用耦合器的设计