浅谈运维工具应用与发展

时间:2022-08-23 05:29:33

浅谈运维工具应用与发展

摘要:随着各种业务对信息系统的依赖性渐重,企业的IT基础架构规模正不断扩张,各行各业IT运维水平也参差不齐,既有大集群的复杂运维环境,也有服务器设备少,运维基础设施差的运维环境,在不同的企业中,自动化的规模、需求与实现方式都各不相同,因此在技术细节层面,很难实现方法通用,但运维工具的应用发展思路是有其共通之处的。

关键词:运维 大数据 自动化工具

中图分类号:TP393 文献标识码:A 文章编号:1007-9416(2016)11-0234-01

1 运维工具简介

1.1 工具应用阶段

就运维工具总体情况分为以下三个阶段:(1)纯手工阶段:手工操作重复地进行软件部署和运维,无运维工具使用,完全依赖个人经验。(2)脚本阶段:通过编写脚本、方便地进行软件部署和运维,个人的经验的重要性大于运维工具体系,经验很难系统的传承,运维成本高。(3)工具阶段:借助第三方工具高效、方便地进行软件部署和运维。又分半自动化阶段和全自动化阶段,半自动化阶段主要对系统进行自动化监控,对运行数据进行自动化采集,处理过程主要依赖于人工处理;全自动化阶段对系统的全生命周期进行自动化运维,运维人员不再处理具体问题,而是对运维知识库的扩充和修正。

1.2 国内外运维工具应用现状

国外IT服务管理的规范及标准建立较早,经过逐步完善,已成为世界性的规范标准和最佳实践。国外大多数企业的IT部门以ITIL为最佳实践参考,以IS020000作为规范,实施自己的IT服务管理。多数处于以服务、价值运维为中心的发展阶段,实现了运维的高度集中化,运维自动化程度也比较高。

目前国内部分企业已实现运维自动化,如百度已实现作业和管理两大领域自动化。搜狐公司提出“Smart IDC”的概念,实现数据中心运维自动化。

2 运维工具分类

2.1 运维流程管理工具

运维流程管理工具是结合实际运维工作中的流程管理需要,通过工作单、操作票、申请单等方式规范运维实际流程,对运维资源、运维人员、运维事件进行管控。

运维流程管理工具包括:(1)变更流程管理工具流程管理工具并不负责具体的业务操作的执行,只是作为单据系统跟踪流程和确保闭环,是事件流程汇总角色工作关联关系的体现,为风险规避提供审批控制。(2)告警和突发管理工具。通过建单管理告警和突发确保流程的闭环,从而确保故障中提炼总结出经验教训,为度量业务的可用性提供指导,通过人工辅助手段进行风险缺陷知识库管理。

2.2 运维监控告警工具

运维监控告警工具是通过对系统运行涉及的主机、服务器、网络设备、安全设备、数据库、中间件、应用系统软件等的监控指标进行多种采集,并以图像、声音、短信、邮件等多种形式通知相关运维人员进行告警的体系工具,该部分也是目前自动化程度最高、工具类型最多、应用最为广泛的运维工具。

运维监控告警工具主要是zabbix,作为一个基于WEB界面的提供分布式系统监视以及网络监视功能的企业级开源工具。Zabbix主要被用于监控网络上的服务器/服务以及其他网络设备状态,可与多种数据库搭配使用,提供各种实时报警机制,采集数据速度较快。

就目前来看,其主要的技术难点在于各项监控工具的采集指标往往不能够满足个性化的需要,对于脚本化、接口化的第三方监控数据集成效果不太理想,对于采集到的大数据存在重存轻读和重读轻存的取舍矛盾,需要合理化的设计数据采集及转移读取机制,后续的数据知识库建设和自完善目前尚缺乏较成熟的方案,导致了数据价值的降低。

2.3 运维变更工具

运维变更工具是对资源、配置进行统一版本管理,并根据需要进行批量下发的工具,既有主动发现变更,也支持被动获取下载变更功能。

目前主流的包括puppet、cobbler、docker等工具集成了以上各项功能点。就目前来看主要的技难点在于相关工具学习周期较长,使用方便程度较差,对于配置内容的自动化获取更新尚未有成熟的实现模型。

3 运维工具发展方向

未来的运维工具价值不应该仅仅只是系统运行的保障和故障处置,而应该从以下几个方面实现强化运维工具的价值所在:

3.1 事前干预运维工具

对系统建转运过程即开展运维工具干预,通过对系统的源码、试运行数据进行管理分析,对系统所需资源通过与其他系统横向比较及系统自身运维数据变化的纵向比较,从而对系统的转运控制、资源分配进行预防式管理,主要分为两个方面:(1)系统预检监测工具:通过对系统的运行指标的数据监控以及对代码的智能化分析,排查项目建设过程中遗留下的隐患,目前主要侧重于代码的性能与安全问题。(2)系统资源合理分配策略制定:通过建立系统运行的知识库,以系统运行的资源占用情况的同比数据为依据,对系统进行合理的资源分配,避免资源浪费和资源不够的情况出现。

3.2 事中知识库智能运维工具

事中知识库智能运维指的是在系统运行的过程当中遇到的一些问题进行相应的解析与判断,而这些判断与解析则是根据知识库进行智能的选择。与平常的应用程序或者工具不同的是,基于知识库的智能运维可以将某一领域的问题求解通过相应的知识显示的表达出来,而非是通过程序段中隐藏的代码来解决问题。

通过知识库方式的智能运维,可以很好的解决某一层次或者某一领域所对应的问题,因为其知识库相对比较单纯,并且知识库将知识与信息进行了有序化,其寻找和利用时间大大的减少,从而可以构成较高效的系统。

3.3 事后大数据挖掘运维工具

通过运维工具所产生的各种类型的数据,比如监控资源的信息,告警信息,日志信息等数据,对这些有意义的数据进行专业的处理,对数据进行加工,实现运维数据的再次利用,从而分析预测出各监控资源的运行情况,从而给运维人员一些合适的建议,这就是事后大数据挖掘工具的特点所在。

4 结语

随着技术的不断发展,业务范围的不断扩大,运维的方式也从最初的手工运维,到脚本运维,以及工具化运维,这表明了对运维工具要求在不断提高,。通过运维工具把一些复杂的任务简单化,将运维人员从繁复的运维体系中解放出来,是运维工作未来发展的必然方向。

上一篇:基于DevOps的软件开发管理模式 下一篇:互联网时代大数据技术与应用研究探析