IT运维内外兼修

时间:2022-04-07 09:21:06

近年来,中国石油结合自身发展战略和业务需求,加快了信息化建设进程,将信息化作为提高生产经营管理水平、促进业务流程优化、加强内部控制、提高决策质量和效率的重要手段。

在实际工作中,通过对信息运维管理的分析研究,并结合销售信息运维工作实际情况,中国石油四川销售公司逐步摸索出适应成品油销售企业需要的信息运维管理模式。

成品油销售企业信息运维管理的现状

随着企业信息化建设不断推进,各管理环节对信息系统的依赖性越来越高。保障企业信息平台系统高效、安全运行成为了企业信息运维日常工作的首要目标。近年来,中国石油四川销售公司不断加强信息运维队伍的建设,为公司信息化建设的可持续发展提供了有力支撑。与此同时,由于种种原因,信息运维效果还不能让人完全满意:一方面运维人员像救火一样被动地扑灭不断冒出的故障“火苗”,疲于应付;另一方面各种系统问题仍然时常发生,感觉好像所有的付出都打了水漂,信息运维能力已经成为企业加快发展的瓶颈,并反映在以下几方面:

运维人员不足,运维队伍建设有待进一步加强。在信息运维管理体系的三大核心(人员,流程、技术工具)中人员组织因素是根本,目前四川销售公司的运维管理面临人力严重不足的问题:按照现有管理模式,每个二级公司信息部门一般为3~5人,这几个人要负责整个公司的系统建设、运维、信息资产管理、信息安全管理等,有限的人力需维护的信息系统多、设备规模大、范围广、领域宽,一人多岗的现象严重。运维人员疲于解决问题。不能深入分析问题根源,难以预防问题再次发生。

运维管理仍然以被动式、救火式为主。日常工作中,通常是用户先于信息运维人员发现问题,然后再找到运维部门要求解决问题。随着近几年信息化达到一定的规模,这种运维方式的弊端就暴露出来了。由于运维人员的精力有限,在专业应用系统赖以生存的各基础设施支撑单元上很难做到专、精、准的多面手角色,加之由于管理范围的界定和监控手段的限制,导致问题发生后,运维人员很难直接判定问题是出在基础网络、系统服务器、数据库还是应用系统自身,故障难以定位将直接导致业务恢复时间的推迟,影响业务系统的正常运行,大大降低服务质量。

运维工作流程还需要补充与完善。当前的运维工作中存在部分流程与职责划分不够规范、操作与流程规定不符等问题。同时现有的运维管理流程的统计和分析功能不足,特别是相关员工完成绩效的管理指标难以统计,数据不完整也不准确,很多事件没有进入事件流程,使得大量工作没有得到及时的记录和跟踪,造成运维工作中没有足够的准确的数据支持。

运维组织管理有待加强。目前对运维队伍应怎样建设还没有非常清晰的概念。只是按照需要设立了一些岗位,至于这些岗位的设立是否合理、岗位职责是否科学、每个岗位的人数是否合适,没有相应的标准依据。还没有一套比较完善的运维组织内部的考核机制和内部控制体系,无法对运维工作的质量、效率进行考核,导致运维工作随意性大、运维质量难保障。而且组织协同有待完善,各级运维组织之间的协同机制、治理管控和职能定位还需要明确定义。

成品油销售企业信息运维管理模式的选择

企业具体选择哪一种信息运维管理模式需要综合考虑业务、人员、技术、安全、财务等多方面的因素。从中国石油四川销售公司目前的现状来看,一方面企业急需改变目前的运维管理局面,有必要构建一个全面的、科学的信息运维管理体系,发挥信息化建设的最大效益。另一方面,由于受编制、费用等条件限制,不可能不受限制地建设一支规模庞大的运维管理团队。

结合上述分析,在成品油销售企业应该采取的是一种外包服务与内部运维相结合的三级运维管理模式。整个运维管理体系分为三个层级:技术支援级、运行监控级、现场作业级。(见右图)

第一级 技术支援级

技术支援级是整个运维管理体系中的最高管理层级和技术后盾,它的主要职能:一是负责对全公司整个运维工作进行指导和管理,二是负责对全公司运维工作中出现的难点、热点问题进行技术支援,三是负责对各层级运维人员开展技术培训。技术支援级可以按照不同的运维对象分为硬件组、网络组、各专业系统组等。该层的技术人员由两部分组成,一部分是由全省运维队伍中技术水平较高的人员以及各专业系统关键操作人员组成内部专家组,另一部分是由设备供应商技术人员及外包服务商的专家组成的外部专家组。

第二级 运行监控级

运行监控级是在企业运维管理中的关键层级,它的主要职责是负责对企业生产经营中使用的信息设备、网络、系统进行7×24小时的运行监控和故障管理,确保其正常平稳运转。该层级工作主要由公司内部运维工作人员通过一定的技术手段(监控系统、维护工具等)来实现,通过该层级工作,要实现设备集中维护、故障事前排除的目标,如果该层级的运维工作能较有效地完成,将大大降低现场作业级的工作量,减轻运维人员的工作强度,提高运维工作效率和质量。

第三级 现场作业级

现场作业级是运维管理体系中的基本保障,它负责对发生故障的信息设备、网络、系统进行故障修复。由于该层级工作有及时快速处理的要求,因此运维工作人员必须具备一些综合维护技能,同时运维工作人员数量也必须要有保证。鉴于现有条件限制,在日常工作中,建议采取内部运维与服务外包相结合的方式进行,内部运维由信息部门运维人员主要负责,同时在每个片区、库站指定一名相对熟悉信息技术的人员作为现场支持人员,协助运维工作人员完成故障处理。运维外包则是将一些非核心的维护、故障处理工作交由维护专业技术较强的服务商完成,由信息管理部门对其进行考核管理。

内部运维管理

运维管理体系需要不断完善,从粗放和分散式管理,逐步过渡到科学、规范和专业化管理,使运维管理成为信息管理日常工作的重要组成部分。

加强信息运维与业务的融合。信息运维不仅要能管理日益复杂的信息系统,而且还要让信息运维能灵活地支持业务的变化,进而提高信息服务的支持能力。因此信息运维就必须与业务部分能够“对上话”,相互融合,形成一个统一的视图。

建立完善的运维考核机制。目前信息运维部门普遍面临的一个窘境,就是如何实施有效的绩效考核制度。由于没有明确的量化指标,每年考核运维部门的指标都是参考其它业务部门的考核体系,再增加一些技术指标,但是这些指标根本就体现不出运维部门的价值。因此必须建立一套自己的运维绩效考核机制:一是在财务方面对信息化运营进行控制,主要目的在于促进投资建设的合理化,这样也可以同时降低运维管理的成本;二是信息化服务运维的职责在于给客户提供运维服务,因此对于运维的考核也应该考虑到用户角度,可以从用户满意、服务的效率来分析;三是在运营方面对信息化服务运维工作的绩效考核,主要体现在服务保障上,确保服务的可用性、安全性。为达到运维工作有效考核的目标,在信息运维考核中必须要有量化的指标支撑,因此建立一套运维管理系统是运维绩效考核能否正常开展的一个重要前提,只有通过这些量化的指标,才能有效地对运维工作情况进行准确合理的考核管理。

完善运维队伍建设,规范制度建设。充实信息技术专业人员,加强运维队伍建设。制定统一的运维规范及标准,建立信息设备、网络、系统管理规范,建立运维管理维护流程和信息安全管理制度等,明确各层运维人员的职能职责和管理流程,提高工作效率,确保运维工作的及时性,实现业务与技术的融合。

加强培训力度,营造良好的专业技术学习氛围。建立定期长效培训机制,促进信息工作人员对服务理念、信息技术、制度流程、运维管理等知识的学习、理解和掌握,提升个人的技能和管理水平,营造良好的专业技术学习氛围,成立各种技术课题讨论小组,鼓励运维专职技术人员在业余时间专研信息技术,提高信息运维能力。

规范细则,强化运维标准化管理力度。标准化是实现科学管理和现代化管理的基石。推进运维标准化管理,建立科学规范的工作秩序,有利于克服工作的随意性,盲目性,增强工作的条理性、规范性,从根本上提高运维管理水平,保证运维工作质量。

建立运维监控系统,提高事前故障排查率,将故障扼杀在萌芽状态。建立一种有效的集中运维监控管理系统,对系统进行日常监控,帮助运行维护人员快速地分析出应用故障原因,有能力把问题在萌芽状态解决,减少现场处理时间,把运维人员从繁杂重复的劳动中解放出来。

推动运维知识库的建设。运维知识经验的总结、维护和共享是提高员工运维技能水平的重要手段,要在企业中建立起一套知识库管理系统,建立知识总结共享的制度,将知识库建设作为一种长期性、持续性的工作,不断优化、提炼、更新知识库。

运维外包服务的管理

当信息运维专职技术人员不足,且专业技术力量不足以自主地维护所有专业技术较强的软硬件设备时,引入运维外包服务是当前的一种必要选择,有利于企业利用外部优秀的专业资源,有效降低运维成本。要做好运维服务外包管理工作,应从以下方面入手:

首先,选择合适的外包内容,逐步逐块地外包出去,可以先选择服务运作标准、自己容易掌控的部分,以及专业技术要求高的软硬件设备进行外包,如计算机终端及附属设备的维护、网络维护、视频监控设备等项目的维护等。

其次,确定外包方式,现有外包方式有两种,一种是根据各外包内容选择最适合的服务商,然后由被维护方负责各服务商之间的协调,另一种是由一个服务商负责其它服务商之间的协调和管理工作。就成品油销售企业而言,第一种外包方式应该是较合理的选择。

第三,加强外包服务商的管理。外包不是放任自由,而是要突出工作的层次,显现信息的功效。所以外包不管采用哪种模式,企业的信息部门都要执行项目管理工作,要在企业中建立一支强劲的项目管理队伍和监控队伍,以有效地管理外包商,以便在启动外包工作的前期阶段,与服务商就外包的流程、责任切分和服务质量的指标等明确落实,形成书面的、可操作的执行手册。充分考虑外包服务可能造成信息安全和信息保密等事故,必须签订信息保密协议及确定运维授权访问模式等。

第四,建立对外包服务考核机制。运用制定好的评估指标和评估标准,按照严格的流程,在定量与定性相结合的基础上进行对比分析,对运维服务外包做出客观公正和准确的综合性评判,发挥评价考核工作的导向作用,推动运维外包服务管理水平的持续提升。

上一篇:微软的App鸿沟 下一篇:安卓恐慌 32期