电信网络集中告警系统建设难点与对策分析

时间:2022-09-08 03:48:29

电信网络集中告警系统建设难点与对策分析

摘要:建立一个综合化、智能化、服务化的电信网络告警管理系统,满足运营商对低投入、高效率的网络管理的需求,是网管系统发展的方向。文章论述了电信网络集中告警系统建设难点与对策。

关键词:电信网络;集中告警系统;异构性;智能化;运维成本

中图分类号:TN915文献标识码:A

文章编号:1009-2374 (2010)19-0030-02

1电信网络集中告警系统的建设需求

目前国内电信网络环境,如交换网、传输网、移动网、IP 网、智能网、信令网、同步网、机房电力等的异质化日趋严重,而且由于目前的网络管理以及管理不同设备的工具大多只能执行垂直管理,这就影响了运行维护和网络优化的进一步提高。因此,建立一个综合化、智能化、服务化的电信网络告警管理系统,满足运营商对低投入、高效率的网络管理的需求,是网管系统发展的方向。

总的来看,电信网络集中告警系统建设需要解决以下问题:

1.1本地网运维成本高

随着业务的不断拓展,每个本地网都存在厂商设备杂,专业网络多的情况。为了切实管理这些设备,每个管理中心都要配备大量的监控终端,每个终端都要配有专门的人员,这无疑加大了本地网的运维成本。集中告警系统应能将交换、传输、数据、电源、PHS、移动网络的主要告警呈现在一个综合的平台上,是本地网集中化维护的经济解决方案。

1.2各专业告警存在异构性

各专业网信息格式存在巨大的差异,为管理人员判断故障带来了麻烦,而集中告警系统应能将告警数据格式进行统一规范化,即各专业网不同数据格式和不同信息格式的告警转换成专业内统一的格式,而后再传给应用服务器。应用服务器经过告警相关性分析后,找到告警源和受影响的业务和客户,同时系统应能支持对收集到的告警进行级别的重定义。

1.3缺乏对大客户的管理

目前国内的专业网管系统并没有将电路和大客户电路资料关联起来,缺乏对大客户的有效管理。集中告警系统应能按照客户等级及业务等级来管理和监控客户业务电路,实时发出业务故障告警和业务障碍处理超时预警。使电信运营监控人员能够做到早发现、早处理,按照业务等级和超时预警级别的优先次序,保障业务电路达到业务差异化服务和SLA协议条款的要求。

1.4故障处理经验不能积累

故障处理的先进经验不能得到积累,造成知识财富的无形丢失。集中告警系统需提供告警专家库功能.根据日常的维护经验,监控人员可以把对某种类型的告警处理经验入库,一旦相同的告警下次再次发生,其他的监控人员就可以借鉴前人的经验,从而提高业务水平。由少到多,由量变到质变,从而积累成一套知识宝库。

2集中告警系统架构分析

如图1所示,综合告警系统系统架构包括:

(1)数据采集层:完成对交换、传输、数据、动力、增值等专业系统的数据采集。数据采集层中包含了一项重要功能:接口管理功能。作为重要的后台支撑系统之一,通信网络综合告警系统和其他外部系统共同协作完成对业务保障的要求,系统必须拥有丰富强大的接口功能,提供开放、标准、规范的接口,除了和专业集中网管系统/厂商网管系统/网元的接口互连外,还和综合网络资源管理系统、前端系统、用户网管、服务保障系统、运维管理系统以及其他系统交互。

(2)数据中心:完成对采集数据进行存储、数据分析及挖掘,具有告警数据的存储、预处理功能;

(3)网络层视图:完成告警管理、性能事件、配置管理、系统管理、拓扑管理及报表管理;可以进行灵活的配置,支持不同用户进行不同的配置,具有灵活的伸缩性和强大的扩展功能。

(4)业务层视图:完成告警影响分析、告警查询与统计等功能。

(5)业务展视:具有告警板、告警总览、大屏幕显示及GIS,可以进行清晰直观的可视化操作,使用户多视角、多方位、全面了解网络,更好地进行网络分析和优化,为保障网络的运行提供有力的依据。

3项目实施中的难点与对策分析

集中告警在实施中要和多厂商的多种接口进行通信,在项目实施中会遇到各种问题。

3.1网络接入问题

现有各专业网管得IP无规则性,大部分网管使用私网地址,当并入集中告警时必然造成IP地址冲突;部分本地网担心专业网管接入DCN网会遭到病毒攻击而瘫痪;部分专业网管本身一直运行不稳定,担心接入集中告警后,给厂商排错增加难度。面对这诸多问题,应合理的利用现有的IP资源,划分出便于管理的IP段进行分配,同时合理使用机,防火墙,对部分专业网管实行专线接入。

3.2接口对接困难

很多厂家的部署人员主要致力于硬件方面管理,对软件部署仅仅在安装应用的层面。在开发调试阶段,当接口稍加变化,或者部署环境稍有异常时,就会给对接带来各种困难。对于这一点,应针对每个厂商部署过程中可能存在的问题及解决办法建立共享知识库,使得我方能在既熟悉环境又熟悉程序的情况下,快速帮助厂商技术人员部署应用,并且成功对接。

3.3接口不稳定

本地网由于业务繁忙,维护人员众多,经常会发生关闭厂商接口程序,导致我方无法对接的现象。有时甚至会拔掉接口机的网线,以达到某些本地网自身的特殊需求。面对这些,我们一方面设计了主机监控以及EMS监控,从物理连路和网关通信进程两个层面来实时反映各本地网的工作状态。另一方面制定统一的用户名制度,通知本地网各种注意事项,避免了此类问题的产生。

3.4告警数量大

由于和各专业网管对接,告警数量非常大。面对这些问题,集中告警系统必须制定告警“压缩”策略,也就是通常的过滤,为了不让部分无关告警影响服务器运行,系统还需制定双重过滤机制,第一层过滤保障了服务器能够对关心告警及时处理,第二层过滤保障了不通专业用户的不同关注的需求。

上一篇:封闭式圆形煤场贮煤防自燃探讨 下一篇:动力总成悬置系统的隔振原理及其设计