运维管理范文

时间:2023-10-21 18:08:31

运维管理

运维管理篇1

经研究,在整个IT产品的生命周期中,采购和建设阶段只占全部时间和成本的20%~30%,而运营阶段则占了整个时间和成本的70%~80%,由此可见IT系统运营管理的重要性。然而,在过去相当长的一段时间内,医院的IT信息部门更关注信息系统的建设和应用,而对该系统的运维管理则缺乏相应的重视和研究。大多数医院虽然设立了信息中心或计算机中心来负责系统维护,但维护手段仍停留在较为初级的被动受理和解决故障阶段,缺乏完善的维护管理流程,没有设立明确的运营维护工作的考核指标。部分医院甚至仅委派一名或两名技术工程师负责全部IT系统的维护工作,管理者很难真正了解其IT维护管理水平的高低,进一步改进的方案也就无从谈起。这种停留在初级阶段的系统维护方法,显然无法适应医疗IT应用系统日新月异的建设水平。

IT服务管理领域的标准ITIL

谈到IT运维管理,我们先来了解一下有关ITIL的基本知识。在上世纪80年代末,英国政府商务办公室OGC(Office of Government Commerce)开发出了ITIL(Information Technology Infrastructure Library)的最初版本,ITIL在面世之后,迅速从英国扩展到了全球许多国家。目前,ITIL已经取得了全球IT服务管理领域的广泛认同和支持,成为了IT服务管理领域事实上的标准,目前全球有数万家企业在应用ITIL。

从实践中总结而来,是ITIL最大的特点,最初的ITIL版本就是一系列IT最佳实践的总结。因此,ITIL不是采用先设计整体框架再细化各部分这种“自上而下”的方式开发出来的,与其他的标准有很大的区别。ITIL的最初版本中包含了十个以上的流程组,而后,OGC通过对最初版本的整合,消除了重复和不一致的地方,了ITIL v2版本,共包含7个体系:服务支持、服务提供、实施服务管理规划、应用管理、安全管理、基础架构管理及ITIL的业务前景,这就是被广泛引用的ITIL框架(见下图)。

由于本文讨论的是医院的IT运维管理,不可避免地借鉴了ITIL体系中的许多概念。但需要说明的是,ITIL仅仅是为IT服务管理提供了一个框架和准则,而其本身并非产品,应用ITIL也无需系统支持。参考和借鉴ITIL体系,建立和健全适合医院自身实际的IT运维管理体系,才是我们的目的。本文的重点在于讨论对医院IT运维管理体系的建立,对ITIL本身就不再多介绍了。

当前医院IT运维工作存在的问题

当前,医院的IT系统运维工作通常由信息科或计算机中心等部门来负责。在部分信息化建设步伐较快的医院,已经有专职的技术人员来负责IT系统的运营与维护,部分大医院维护人员人数已经不少,但以下问题仍在医院的IT运维工作中普遍存在:

1. 维护工作以“被动式服务”为主

主要体现在对IT系统的维护往往是在问题发生后,IT维护人员类似“救火队员”一样赶去抢修故障,缺乏主动性的预防式服务,这种维护模式下IT维护部门往往依赖一些技术水平高的“救火英雄”,而忽视了如何从管理的角度去预防问题的发生,结果就是一些本来可以避免的故障反复发生,给医院的业务带来阻碍。

经研究数据表明,IT系统发生的故障,只有20%是因为软件、硬件或环境(网络、电力等)因素造成,而有40%的原因是缺乏管理流程造成的。例如未经测试的变更,或是系统高负荷运转等原因造成,另外40%的原因是由于人员操作失误、备份或安全方面的疏忽所导致。也就是说在IT系统发生的问题中,大多数的问题是可以通过管理来避免的。

2. IT部门与业务部门的沟通不畅

对于使用IT系统的业务部门来说,关心的是业务不中断,IT系统能够安全稳定的运行,而IT管理部门往往是以技术为中心,这样如果在业务部门产生对IT系统的使用需求或者是发生故障时,IT部门往往会将注意力放在技术环节上,而忽略了对方的业务目标。一个简单的例子是,当业务部门由于设备故障(例如台式机)而影响业务时,IT运维部门首先要做的不是解决故障,而是需要清楚恢复业务的时限,如果是恢复时限要求很高的问题,那么IT维护部门可能首先要做的可能不是去解决故障,而是更换一台备用电脑来保障业务在最短时间内恢复。做到这一点就要求IT部门与业务部门有一套共同的沟通语言,这一点在后面讲到服务级别管理时再详细讨论。

3. 不能量化评估IT部门工作的绩效

IT运维部门的绩效往往难以考核,产生的原因是由于未能制定有关IT运维工作的考核指标,日常的IT运维工作通常都由繁琐细微的事情组成,如果没有对关键事件进行记录,没有对各项工作的目标进行事先约定,那么对IT运维工作的评价只能够凭感觉,没有业务部门与IT部门都认可的标准,既谈不到准确评估,更谈不到改进与提高。

建立IT运维管理体系

以上提到的一些问题,在许多医院中都普遍存在。想要解决这些问题,提高医院的IT运维管理水平,需要做的工作很多,需要医院IT部门有计划、分阶段地进行,逐步建立适合医院自身IT水平的运维管理体系。

建立医院IT运维管理体系,至少应该包括四项基本内容:IT运维考核指标(KPI,Key Performance Index);服务台;服务级别协议(SLA,Service Level Agreements);IT基本服务流程。

1. IT运维考核指标

IT运维考核指标是医院IT运维管理体系的核心,只有建立了科学的考核体系,才能对IT运维工作的结果进行量化评估与考核,发现不足,进行改进。IT运维考核指标是针对整个IT运维部门而制定,考核的是IT运维部门的整体绩效,指标的设定应该包含对IT运维工作结果、部门及人员发展、财务等几个方面的考核,我们在这里重点讨论一下应该如何设定IT运维工作结果的考核指标。

IT运维部门的主要职责一方面要对IT设备及系统进行维护管理,保障其良好运行,另一方面要响应业务部门的需求,解决业务部门提出的问题。因此对IT运维工作的KPI设定主要分为IT系统运行水平和IT技术支持水平两大类。在这里对这两大类的常见考核指标做一些介绍,供医院IT部门参考。

(1)IT系统运行水平KPI

通过对IT系统运行水平KPI的考核,可以考察IT运维部门的维护水平,这类指标常见的有:

系统中断时间,指由于软硬件或外界环境原因引起的关键应用系统的业务中断时间,考核周期通常以月或年为单位,而具体目标的设定可根据各自医院应用系统的数量、运行水平来制订,例如:系统中断时间

故障发生次数,指IT系统的故障发生次数,考核周期通常以周或月为单位。例如:故障发生次数

网络安全性,保障网络信息安全是运维工作的重要目标,对网络安全性的简单考核可以用考核周期内网络信息安全问题的发生次数来进行,如果要做更科学的考察,可以根据不同等级的安全问题设立网络安全性指数。

故障业务影响率,这一指标是考察发生的所有故障中,影响业务的故障所占比例,计算公式为影响业务的故障总数/故障总数。

(2)IT技术支持水平KPI

与第一类指标不同,技术支持水平KPI主要考察的是IT运维部门的技术支持和服务水平,重点考察IT部门是否能够及时响应业务部门的申告与要求,服务水平是否达到了业务部门的期望。

故障解决达标率是指在目标时间内解决的故障数/全部故障数。对于不同级别的故障,事先都设定好了目标解决时间,这一指标考核的是在预计时间内解决故障的比例,这比简单考核故障解决率更能反映IT运维部门对业务部门的支持情况。

平均故障解决时间是指所有故障的解决时间之和/所有故障次数。这一指标反映的是IT运维部门解决故障的能力,与第一个指标组合使用,可以更全面地反映IT运维部门的技术服务能力。

客户满意度是指IT运维部门的客户是业务部门,对医院来说就是使用信息系统的各个科室,服务水平的高低最终要反映到用户的主观感知上,因此设立一个主观感知指标是非常必要的。这一指标可以通过对业务部门的满意度调查问卷来实现。

以上3个指标是对IT运维支持水平最常见的考核指标,这类指标还有很多,例如故障响应及时率、故障解决超期时间、重复故障发生率等等。如何设定考核指标,关键是要符合医院的IT管理战略目标和IT管理重点,合理设定不同指标以及所占权重,使得KPI考核能够达到促进IT运维管理的目的。

2. 服务台的职能

对建立IT运维管理体系来说,服务台在其中扮演了非常重要的角色,是建立IT运维服务体系必不可少的一环。我们这里说的服务台并非是一个简单的设立了热线电话的值班员,它有几项最基本的职能:

服务台为用户提供了IT部门的单一联系点,确保用户通过服务台可以找到支持人员,也就是说确保了服务的可达性。

服务台对所有用户请求进行记录,并监控后续处理过程,直到问题解决。这就保证了前面提到的IT运维指标体系中,所需要的数据都有权威依据,如系统中断时间、故障解决达标率等。

服务台作为IT部门的首次联系点,可以过滤掉不相干的问题,并处理掉常见问题和简单问题,而将处理不了的复杂问题再转给IT后台部门,这样就保证了IT的技术支持部门不会被简单的问题所打扰,可以集中精力处理专业性的问题。

建立服务台遇到的常见问题是业务部门在遇到故障时,都习惯于直接找自己熟悉的IT工程师解决,而不愿意找服务台帮助,解决此问题要求IT部门向业务部门大力宣传服务台的好处,同时也要大力改进服务台的服务能力,比如服务台直接服务的水平,响应的时间等。

3. 服务级别协议

服务级别协议(SLA,Service Level Agreement)的含义是IT部门对业务部门的服务承诺,定义了各种服务类型所要求满足的服务质量。SLA的特点是用业务语言描述,而不是用技术语言进行描述。例如,对于故障处理,在SLA里可以将故障分为三类:影响业务的紧急故障、对业务使用存在隐患的严重故障及普通故障。然后分别对这三类故障定义响应时间和解决时间,例如紧急故障要求10分钟响应,1小时解决,而普通故障则要求30分钟响应,3个工作日解决。

只有在有效的服务级别管理被建立的条件下,IT部门才能更加清楚他们被期望提供什么和可以提供什么,因此才能够更好地计划和管理所提供的服务。

4. 建立基本运维管理制度流程

IT运维部门应该建立一系列基本运维管理制度和流程,以确保IT运维部门的基本任务得以实现。IT基本运维制度流程主要包括故障支持流程、IT变更流程、IT日常维护管理制度、重大事件应急管理流程以及IT安全管理制度等。这些基本运维管理流程的建立,是确保SLA能够实现的制度保证,可以使IT部门在向业务部门提供服务时,能够按照标准流程进行,从而保证服务的确定性,并能够比较容易地发现服务中存在的问题,进行改进和提高。

IT运维管理外包的基本情况

以上简要介绍了建立IT运维管理体系的基本概念及方法,最后再介绍一下关于IT运维管理外包的基本情况。

IT运维管理外包是近年来的新生事物,在欧美许多国家,将IT系统的运维工作外包给专业的公司已经比较常见,在国内,部分行业也已经开始进行这方面的尝试。实际上IT运维管理外包这种模式非常适合于医疗行业,主要原因在于:

1. IT运维管理是一项非常复杂和专业的工作。对于医院来说,IT管理并非其所擅长的领域,即使投入很多精力,也很难在短时间内见到成效。而专业的IT外包公司则具有丰富的经验,可以在短时间内帮助医院把IT系统的维护管理工作提升到较高的水平。

2. 专业的IT运维外包公司通常有多个客户,他们通常拥有更多的IT技术人才,更丰富的IT系统维护管理经验,并往往有专业的运维服务工具。例如知识数据库、呼叫中心等,在IT系统维护的资源、技术和管理方面比单个医院更有效率,成本更低。

运维管理篇2

【关键词】运维车间;分散;立体式培训管理网络

1.引言

电力企业运维车间员工工作地点分散,且其三班倒的运转模式给工区各项集训、调考、工作布置等各项工作的开展带来较大困难;另外,设备的快速更新及企业变革带来的复合型人才需求使培训管理工作急待一种更有组织、更具规模性的管理突破。现根据保供运维工区现状针对运维车间培训管理工作进行简要的分析。

2.运维工区现状及员工培训存在的问题

工区现有运维员工255人,平均年龄41岁,呈老龄化趋势。第一学历大专及以上的18人;后续学历大专及以上163人,其余为中专及以下学历。共设13个运维班,所辖138个变电站分布在22个县市,其中3个班组采用“长白班”模式,10个班组采用“三班倒”运转模式。主要负责所辖站运行、维护工作。一般采用集中培训、班组培训与自主培训的方式。

因其工作的特殊性,员工培训存在三个较为突出的问题。一是工作地点分散、三班倒的运转模式给工区各项集训、调考、任务布置等各项工作的开展带来较大困难。二是培训起不到应有的效果。因倒班方式的限制,工区集训只能组织休班成员参加,连续几天的工作后,休班员工有很多生活中的事务要处理,参加集训时会产生抵触情绪,所以培训效果不佳。三是设备的快速更新及电力企业“运维一体”带来的复合型人才需求同样使培训管理工作急待一种更有组织、更具规模性的管理突破。

3.针对上述问题的相应解决方法和措施

更新运维车间培训管理模式,建立“立体式”培训管理网络,并辅助相应的激励机制,通过推动专业管理网络的有效运转、知识共享,全面提升运维员工各项技能,强力组建“一岗多能”的复合型人才队伍。

(1)三维“立体式”培训网络的建立

“立体式”网络培训,由三个维度空间组成。

一维:是由工区培训主管牵头组建的由工区领导、各专业管理、技术员组成的培训网络;二维:是由工区各专业管理牵头建立本专业管理网络;三维:由各班组培训网员牵头将本班组各专业管理网员组建为班组级培训网员。

(2)明确目标、细化指标,实施指标体系

将培训专业必须实现的两个核心指标:应培送培率100%、全员培训率100%,分解为各个工作项目的时间节点及质量控制要求,实现目标值量化,同时为保证各个量化值的实施和实现,绘制指标体系图,将可量化指标与实际工作紧密吻合,不断改进思维、改进方法。

(3)建立岗位规范,明确责任分工

机制的建立需要文件制度、目标、激励机制等坚实基础的支撑。首先依据各岗位规范,在《培训管理》中进一步明确各维度培训网员的培训职责及分工,为培训工作的顺利开展提供组织保证。

(4)有效运用“三个维度空间”夯实员工专业技能

在健全的“立体式"培训管理网络中,各维度培训网员积极发挥自身价值,以工区培工为总牵头人,各专业管理为专业培训项目负责人,制定符合工区实际的培训计划和项目,并组织实施;以培训专责为总策划人,各班组培训员为督导推进人,定期督导并推进培训计划的落实;以各专业专责为总教练员,各班组相应专业管理网络成员为实施推广员,通过工区级的专家培训和班组级的落实推广,切实做到学以致用。通过三维立体培训网络的实施,进一步提升培训效果,同时助推专业管理网络的有效运转。

1)“一维”阶梯式培训,减小员工技能差异

“立体式”培训“一维”培训带头人——工区培训专责,首先要针对培训工作中发现的诸如电网新设备、新技术对运维员工的要求越来越高,统一组织的培训没有针对性,员工技能提高缓慢的问题,组织“一维”网员(专业管理及班组技术员)在认真分析素质胜任力和岗位能力的基础上,评估员工工作的差异性能力,根据其结构特点划分技能梯队;工区各专业管理(“二维”培训牵头人)将运维专业培训项目分模块,如:电力基础知识及变电站值班员技能鉴定、倒闸操作及异常、事故处理及现场把控、综自保护专业管理及班组管理、智能电网及数字化变电站五个模块,并对应列出培训计划,利用培训计划的纲领性进行最有针对性的培训,员工技能等级得以快速提升。

2)“二维”专业培训,夯实技能基础

“立体式”培训“二维”培训带头人--各专业管理,结合本专业特点及日常工作中发现的技能弱点制定有效的培训计划上报培训专责,培训专责组织实施,并组织各班组级专业网员采用抽调考的方式进行培训效果评估。专业性的培训,即能够有效的培养专业能手,又能够有效推动专业管理网络有效运转。

例如:工区主管可靠性、及PMS的两位“二维”专业牵头人--运维管理,针对可靠性、PMS系统的应用及日常填报过程中发现的问题,组织本专业班组级网员,采用每周一通报、一讲解的方式进行点滴式贯彻培训,收到良好的效果--多名在省公司竞赛中均取得了优异成绩。

3)“三维”班组培训,固化专业技能,夯实安全基础

“立体式”培训“三维”培训带头人--各班组培训网员组织本班组各专业管理网员,将从专业管理那里汲取的专业知识,结合班组倒班特点、所辖设备特点、人员特点开展针对性的集训、现场培训、现场模拟事故处理等,在现场培训过程中直接发现每位员工的技能短板,现场指导,有效解决了因倒班带来的培训漏项的问题,更能够起到“查缺补漏”、逐个提升的效果。目前各运维班组在结构性缺员的情况下,各项工作均能够有效开展。

(5)完善管理文件,固化良好做法

在“立体式”网络培训实施过程中,不断完善管理文件,如将各维度培训网员的工作要求、时间节点纳入文件。通过不断的修订、执行、检查再修订的PDCA循环,工区培训管理文件日益完善,为培训工作的有序开展进一步奠定了基础。

(6)建立培训检查、激励机制,激化各级网员及每位员工进步能量

各项工作的稳固开展和不断提升均离不开互查交流这一重要环节。“立体式”三维训管理要求班组专职培训网员每月开展培训自查、整改;工区培训管理按《运维工区工作检查管理》5.6条及附录F培训管理月度工作检查,每月至少抽查3个班组,限期整改,班组整改完毕后反馈,工区组织复查、收存及时发现问题,调整培训方式,提炼推广典型经验,确保员工技能有效提升。

机制激励是一种手段,也是推进培训工作的重点,工区将各维度培训网员培训工作与绩效考核管理挂钩,建立专业管理年度绩效合约、培训专业一线员工积分指标库。

并在此基础上建立班组培训对标管理,细化培训考核实施细则,每季对标,并结合对标结果、普调考、竞赛结果填报月度绩效考核表上报劳资管理,工区进行沟通交流后列入月度绩效考核。从各角度激发员工培训热情,强化进步能量。

4.结语

通过对运维工区培训工作现状的分析发现:员工培训效果与工作方式、企业环境存在很大得联系,而有效的“立体式”培训网络管理是运维车间实现知识共享、快速提升员工各项技能的有效途径。

参考文献:

[1]电力职工教育培训[Z].电力职工教育编辑部.

[2]蒋小华.为结果而战:打造以结果为导向的执行模式[M].中国经济出版社.

运维管理篇3

简介: 无尘室洁净度之维持和控制,除了硬设备之配合投资外,也需要良好的软件——管理制度来搭配,方能维持良好的洁净度;无尘室运转管理,可依作业人员、原物料、设备及无尘室内所用东西等加以探讨;无尘室内系统除了通称的空调系统之外,制程设备也包括在内,本节将对该二系统之运转维护及保养做一概略说明。

关键字:无尘室 污染源 运转管理 维护保养

运维管理篇4

关键词:电力系统;变电运维;安全管理;设备维护

变电运维是电力系统运行中非常重要的工作内容,主要包括变电运行和变电维护工作。相关的工作人员会分成两部分,一部分进行变电系统的检查和巡视,另一部分负责专业的维护和修理,实现全方位的电力系统安全和设备的维护。

1变电运维安全管理和设备维护中存在的问题

1.1缺乏对设备维护的重视度

在变电运维工作具体实施过程中,很多工作人员对相关设备功能和组成部分了解不足,在进行维护方面又不重视,还是利用旧式的维护思维和措施,导致很多的变电设备存在安全问题。其次,还有很多的变电运维人员受自身专业能力的限制,对一些相邻领域的设备不够了解,导致变电设备缺少一定的维护,安全性和稳定性得不到有效的保证;电力企业相关的管理人员对变电运维安全管理和设备维护的重要性认识不足,缺乏对自身企业员工的定期培训和专业能力的提升,导致企业变电运维工作人员的专业技能得不到提升,变电系统的安全和设备维护也缺少高超技术的辅助。

1.2变电运维安全管理和设备维护的方式不合理

在电力系统设备检查和维修的过程中分为很多种形式,主要包括预防定期式检修、状态检修、故障检修等,目前我国电力系统受到多种思想和因素的影响,大部分都是进行故障检修,电力系统真正出现问题的时候再进行检查和维修,这对检修工作的全面化进行具有非常严重的影响,不能对电力系统及设备的故障进行预防和控制,对电力系统和设备的使用周期具有很多的不利影响,大大降低了电力系统和设备的检修效果,这种后知后觉的方式非常不利于电力企业的长期稳定发展,变电运维安全管理和设备维护的方式不合理,对电力企业电力系统的安全运行造成很严重的威胁。

1.3电力系统安全管理机制的不完善

要想有效解决电力系统变电运维安全方面的问题,基础的措施就要进行电力系统安全管理机制的建立,但是很多电力企业没有意识到这一点,只是将重点放在电力系统的维护和管理上,在安全管理方面有很多的不足,缺少电力系统的安全管理机制,在具体的工作实施中就没有明确的目标,各个专业领域的工作人员的责任感较差,各项工作任务也难以有效落实。

1.4对电力系统规章制度的执行不统一

电力企业在进行电力系统安全管理和相关的维护措施的实施过程中,通常都是由企业的管理部门进行规章制度的要求下发,然后各个部门分别实施并上报,反馈安全管理制度和维护措施的执行情况。但是还是有一些部门忽视电力系统规章制度,执行力差,导致电力企业内部的制度执行情况不统一,最终引发很多的安全问题和设备损坏等,严重影响电力企业电力系统的稳定运行。

2加强变电运维安全管理的有效措施

2.1建立完善的变电运维安全管理制度

为了保证变电运维过程中的安全,电力企业应该根据自身的具体运行情况,并与现行的管理方式相结合制定变电运维安全管理制度,对电力系统设备及相关的工作人员实施高效的安全管理。在变电运维安全管理制度中应该充分体现安全管理的最终目的、安全管理的范围以及具体内容,对整个电力系统运行涉及到的人、设备以及各种情形进行规章制度的约束,设置有效的监管系统,并派专门的制度监管人员督促管理制度的有效实施,让变电运维安全管理制度贯穿整个电力系统的运行。

2.2提高变电运维相关工作人员的综合能力

电力企业要想实现高效的变电运维安全管理,就要促使现场操作人员提高安全意识,重视全体工作人员综合素质的培训,对变电运维过程中的每个细节进行详细分析和反复强调,避免在实际操作过程中忽视设备细节,导致系统整体安全事故的发生;加强变电运维工作人员的综合素质,促进员工认真工作习惯的形成,减少操作失误的情况发生。

2.3注重信息化的安全管理

电力企业在进行电力系统安全管理的过程中,规模较大,管理的数据也非常复杂,整体综合性较强,进行信息化的安全管理能够有效分析和整合数据,促进后期管理内容的准确实施。对变电运维信息化的安全管理通常都是通过服务器进行传输数据,变电站与各个供电单位进行网络连接,及时进行管理数据的传输,然后上级管理部门根据数据进行信息的不断更新,促进电力系统实行全面化、系统化的动态管理。

2.4制订安全管理应急方案

安全应急预案常在安全管理中发挥关键作用,以防突发安全事故,完善安全管理计划,可以最大程度地减少事故造成的损失。由于变电站的运行受多种因素的影响,包括自然因素和人为因素,这些都会影响变电站设备的安全运行。如果没有科学的应急计划,将在发生紧急事故的情况下严重损坏电力系统。

3加强变电运维设备维护的有效措施

3.1对变电运维设备进行定期维护

加强变电运维设备维护最有效的方式就是对设备进行定期地维护,建立相关的维护制度,采用固定式的方法做好设备的各项预防措施。可以开展季度或是月度检查,并对变电运维中的设备进行定期地试验和检测,促进电网设备各项功能的正常。

3.2有效记录变电运维的设备维护信息

在变电运维检查和维护的过程中,发现问题应该及时进行记录和分析,对设备的故障原因、故障部位、维修方式、维修结果等进行仔细记录,可以采用图片与文字结合的形式进行有效记录,为后期相关工作提供有利的参考。

3.3完善变电设备检测评价机制

变电站设备检测评估机制的完善,是提高变电站设备安全运行和维护的重要手段。该机制应在变电站设备运行前,运行中和技术改造后,进行严格科学的检查和设备状态评估。及时发现变电站设备运行中的隐患,并及时排除,以提高变电设备的电气性能。

4结语

运维管理篇5

【关键词】虚拟技术;IT运维;运营商

当下,随着商业竞争的加剧,运营商实施业务的部分转型在所难免。为了支撑这些转型业务,需运行更多的IT系统,如何实现这些系统的低运维成本、高运维效率是一项新的课题。

1运行商的IT运维现状

为配合业务转型而增配的IT系统在部署上多采用“Web+应用服务器+数据库”的结构,具有软件种类多、PC机数量大、操作复杂化等特点;但另一方面,因转型业务非主业,业务量相对不大、系统负载相对低下。因此,当前运营商IT运维面临的挑战是:运维成本在持续上升,但运维效率呈现下降趋势。这需要引入虚拟化技术加以解决。

2关于虚拟技术

2.1虚拟化及其特点

所谓虚拟化,就是削弱用户对物理计算资源的直接访问,代之以对逻辑资源的访问。其实质是以虚拟连接取代物理连接,最大程度减少物理资源的配置。虚拟化的主要特点包括:

2.1.1封闭所有虚拟环境构成一个独立文件,既符合兼容性,又易于备份、转移和复制。

2.1.2隔离虚拟化环境中每个虚拟机互相隔离,数据不会在它们之间泄露。

2.1.3分区应用虚拟化后,计算资源被放置在资源池中,同一个硬件可被多个操作系统操控,提高物理资源利用的有效性。

2.2关于虚拟化软件

虚拟化软件是操作系统和物理硬件之间的“桥梁”,通过该类软件,不管硬件如何更新,从操作系统看到的均是通用硬件,即虚拟化软件可处理硬件的差别。这样,IT系统也具备了在不同物理平台上转移的能力。虚拟化软件的发展已历三代:

(1)第一代通过hypervisor或者主机架构提供服务器分区能力;

(2)第二代增加了生产力的规划、虚拟化的管理、物理服务器迁移至虚拟机的功能;

(3)第三代将标准服务器和存储虚拟化聚合成一个动态资源池,可保证任何资源处于高可用状态。目前市场度较高的虚拟化软件主要是VMWARE公司的VI3。

3虚拟技术在IT运维管理的应用

3.1软件套件的选用

我们以VMWARE公司的虚拟化软件作为解决IT运维问题的选择。根据实际要达到的管理效果,选取VMware的软件套件如下:

(1)VMwareInfrastructure。其为基础架构,直接安装于硬件服务器;

(2)VMwareESXServer。其为核心部件,完成对硬件的抽象;

(3)VMwarevirtualSMP。实现服务器对称多处理器的虚拟化;

(4)VirtualCenter。对VMwareESX形成统一管理和监控;

(5)VMwareVMotion。为VMware虚拟机提供自动、动态迁移;

(6)VMwareHA。负责应用程序可用性;

(7)VMwareDRS。实现对虚拟机可用资源的统一调度;

(8)VMwareConsolidated。此为驱动程序和脚本,用于备份;

(9)P2VAssiatant。用于物理机向虚拟机的迁移。

3.2降低运维成本的方案设计

总体思路:构建服务器资源池,提高服务器被利用效率,减少硬件购置数量。实施对象:针对IT系统中的Web层和应用服务器层的应用效率低,主要就这两层进行整合。拓扑结构,见图1所示。方案说明:

(1)首先筛选出负载相对较低的Web服务和应用服务,作为整合对象;

(2)选择性能佳的一定数量服务器,配以VMWARE软件套件,形成服务器资源池;

(3)根据整合需要建立虚拟机单元,分配CPU、硬盘、内存、网卡等资源;

(4)安装OS、被整合结构层的软件,完成系统虚拟化。某地运营单位的应用实例表明:通过该方案,可达到服务器瘦身目的,缩减运维成本。

3.3提升运维效率

方案总体思路:构建备份资源池,对各备份进行集中管理,以简化备份操作和缩短恢复时延。实施对象:IT系统三层结构。拓扑结构,见图2所示。方案说明:

(1)将相关的VMWare软件套件安装至备份服务器(相对独立),形成备份服务器资源池;

(2)通过VMwarevirtualcenter和存储设备,达成备份虚拟机资源的统一分配和集中管理。因备份虚拟机是封装了全景备份环境的一组文件,具有一次构建多次部署特性,所以大大降低了备份操作的复杂程度,提高了备份效率。同时,虚拟机启动无需经历硬件设备初始化环节,因此能将备份系统的恢复时延从大约几十分钟降低至几分钟的程度,可谓效果显著。

4结语

文章针对运营商IT运维难题,提出采用虚拟化技术来达到运维成本降低和运维效率提升的双赢效果。文章着重就VMWARE公司软件套件的应用展开叙述。在实际实施中,我们主要要做好网络规划、存储冗余、资源池管理等环节。虚拟化是一门新兴技术,其潜力非常巨大,应注意在实践过程中进行深层次的探索。

参考文献

[1]许锦丰.服务器虚拟化技术在主机运维中的应用[J].软件,2013,19(3):132-135.

[2]梁天健,胡杰.虚拟化技术在电信IT系统中的应用实践[J].数字通信,2013,6(2):226-228.

[3]李芸菁.企业IT运维虚拟化研究与实现[J]质量与标准化,2014,18(1):26-28.

运维管理篇6

关键词:地铁运营;设备维修管理系统;运营管理应用

地铁运营公司很重要的一项工作就是地铁设备维修管理,在工单管理以及维修机换的基础之上,必须要加强维修进度管理、维修计划管理以及设备管理,不断地对地铁设备管理进行优化,促进地铁综合维修保障能力的不断提升,从而使地铁的安全运营得到保证。作为地铁运营管理的重要环节,地铁设备的维修保养是促进地铁安全运营的重要保障。如何对地铁设备进行更好地管理,将地铁设备的安全性和可靠性提高上去,从而使地铁设备的使用周期尽可能的延长,已经变成地铁运营管理中越来越重要的课题。

1 地铁资产设备修管理简介

作为一个典型资产密集型行业,地铁行业对安全的要求特别高。地铁运营管理工作中比较重要的工作就是如何将资产设备尤其是与运营安全有关的设备管好用好,使设备的可用性不断地提高,从而使设备的生命周期尽可能的延长[1]。

地铁公司必须要以公司发展策略、整个城市的发展策略以及线路规划为根据,做出地铁新线路建设的决定,在新线路的建设过程中必须进行大量资产设备的采购,在接受资产后,运营部门必须要对设备进行登记,将设备台账建立起来,在制定预防性维修策略时必须要根据不同设备的具体情况来进行,同时以预防性维修策略为根据来制定设备维修养护计划,在维修养护计划生成以后对所需的物料需求和人力需求进行计算,将中长期预算制定出来。地铁运营公司要以维修计划为根据来进行设备的维护工作,在运行过程中设备一旦发生故障,就必须要对故障设备进行维修[2]。与此同时,所有的运营数据都是从相关设备系统中获取的,比如车站温湿度、闸机出入人数以及列车行走里数等。以设备发生故障以及维修的情况为根据,对涉笔的性能进行分析,从而将设备报废置换建议、改进方案以及维护方法提出来,必须要进行的更新报废设备。

2 地铁维修管理系统在地铁运营管理中的应用

通过分析地体设备管理业务,我们可以发现,有以下几个方面的内容包含在设备维修管理系统当中:报表分析、维修预算、工单管理、预防性维修计划以及设备管理等[3]。

2.1 维修预算的应用

预算在地铁运营管理当中是非常关键的工作,而运营预算中的重中之重就是维修预算。维修预算如果做到较为准确,可以为维修工作提供非常强大的人力和资金支持,推动维修工作可以以原定计划为根据不断地执行下去。

维修预算在设备维修管理系统中可以分为基于经验的预算、基于故障维修的预算以及基于维修计划的预算等[4]。

在设备标准工作和维修计划当中基于维修计划的运算对物料需求和人力需求进行了详细的定义。可以以设备维修计划为根据将未来五年以内的物料需求和人力需求计算出来。基于故障维修预算在计算维修预算时可以以设备历史故障维修记录来进行,因为设备故障发生的几率是不同的,所以需要让地铁运营企业对几年以内的故障维修记录进行指定参考,同时将不同的权重制定出来,再对每年的故障维修成本统计出来,与权重相乘就可以将故障维修预算得出来。当然,上面所说的两种预算不可能包括着所有的预算,因此,地铁运营企业还可以将以往的经验作为根据将估计出的预算输入进去。在最后,进行汇总从而形成年度预算,同时允许用户调整生成的运算[5]。

2.2 报表分析的应用

以工单信息、维修计划以及设备台账为根据,系统能够将设备故障率、外包维修工作有效性分析、预算差异分析、维修实际费用、定期检修遵守制度分析以及维修成本分析等各类报表做出来,以便于管理维修人员的改进、维修以及分析工作[6]。

2.3 委外维修管理的应用

由于技术或维修成本等原因,在地铁运营设备维修管理中某类设备或某些设备在维修时外包给专业承包商,委外维修管理在设备维修管理体系中的主要功能是工单填报、维修计划分配、委外用户权限设置、委外合同管理以及承包商信息管理。

承包商信息管理要对承包商的基础信息进行维护,比如评级、电话、联系人、地址、承包商名称以及承包商编号等。而委外合同管理主要是对与承包商签订的维修合同进行管理,其中包括维修设备列表、成本中心、合同有效期、承包商编号、合同描述以及合同号等。委外承包商在对设备维修管理系统进行使用时,必须要严格的控制其权限,从而使系统的安全得到确保,比如外商用户如果承包1号线闸机,就只能对1号线闸机的工单信息以及设备信息进行查看,而无权查看其他设备、工单以及其他线路车站闸机。系统在生成预防性维修工单时对于委外维修设备可以自动向承包商进行分配,再让承包商将设备维修完成。如果委外维修设备出现故障情况时,系统在创建工单时会将工单自动向委外承包商分配。在完成维修工作以后,承包商要填报工单相关信息[7]。

2.4 工单维修的应用

运维管理篇7

【关键词】信息系统 外包安全 外包安全管理模式外

随着信息化技术在日常工作中的不断普及,信息系统运维已经成为信息化工作中最重要的组成之一,信息系统运维涉及数据库、中间件、硬件、存储等多个方面的专业知识,而企业内部信息化工作人员不足,专业技术能力欠缺,为保证信息系统良好、顺畅运转,需要专业化程度较高的运维服务,即信息系统运维外包服务,聘请专业技术人员对系统数据库、中间件等各个环节进行运维,随着信息系统运维外包范围的不断扩大,信息系统运维外包造成的信息安全隐患及信息安全事件不断增加,做好信息系统运维外包安全工作便成了信息化运维工作的重中之重。

1 信息系统运维外包安全管理模式分析

我们先简单分析一下常见的运维外包安全管理的模式,随着信息系统运维外包范围的不断扩大,信息系统运维外包安全管理主要由简单管理模式、制度管理模式和混合管理模式三种。

1.1 简单管理模式

主要依靠“人盯人”和运维工程师的自律实现,即指定专门人员陪同并监督运维工程师的具体操作,要求运维工程师严格遵守职业道德,达到信息系统运维外包安全管理的要求。

简单管理模式的优点是管理成本小,管理过程简单,不需要配备专门的技术人员;存在的问题主要有可操作性不强和管理效果不佳两方面:

(1)由于陪同人员的业务素养不足、技术深度不够、运维过程监管不足等原因,使得“人盯人”方法对信息系统运维外包安全管理可操作性下降,存在造成系统运维外包安全事件的隐患。

(2)信息系统运维外包工作开展过程中,基本依靠运维工程师的自律和职业操守来实现信息系统运维安全管理,难以达到信息系统运维外包安全管理要求,影响运维安全管理效果。

1.2 制度管理模式

通过运维安全制度规范运维商和运维工程师的行为,降低运维风险,实现信息系统运维外包安全管理。在运维合同签订过程中明确运维安全管理制度,并其签订运维保密协议,共同建立违反制度的处罚机制,明确约定处罚内容,在运维工程师入场工作之前先宣布管理制度和惩罚机制,用以约束其运维操作。

制度管理模式的优点是管理成本小,管理过程较为简单,管理体系相对成熟;存在的问题主要有管理可操作性不强和属于事后管理两个方面:

(1)运维管理制度的执行情况不易监控,可能造成管理制度、保密要求和惩罚机制形同虚设,不能够有效地发挥作用,降低运维系统安全管理的可操作性。

(2)制度管理模式属于事后管理范畴,即只能在事故发生后按照管理制度、保密协议和处罚机制进行追责,且追责过程中提取相关证据较为困难,追讨损失过程较为复杂。

1.3 混合管理模式

通过制度和运维安全管理设备(如堡垒机)相结合进行信息系统运维外包安全管理,即在制度管理模式的基础上,增加运维管理设备,该设备具有操作命令记录、操作过程录屏、操作权限管理、访问范围管理和访问时效管理等几个基本的功能,实现对信息系统运维外包安全的有效管理,

混合管理模式的优点是管理的可操作性强,管理体系较为成熟,属于对信息系统运维过程既有事前、事中管理,又有事后审计管理;存在的问题主要有管理成本较大和管理过程复杂两个方面:

(1)运维安全管理设备需要单独购买且需要专人进行维护,这加大了企业信息系统运维安全管理的成本。

(2)运维安全管理设备需要依据实际运维情况进行配置变更,要求设备管理人员充分了解企业网络架构、业务系统构成等内容,结合运维人员的实际情况进行操作权限、访问范围、访问时限等内容的管理,使得信息外包安全管理过程变得较为复杂。

2 信息系统运维外包安全隐患分析

依据对信息系统运维外包安全管理模式的分析,信息系统运维外包存在以下几点隐患:

2.1 信息系统运维外包造成泄密

随着企业日常工作对信息化的依赖不断加大,企业销售、财务、人力资源等重要信息均通过信息系统进行管理,如果对信息系统运维外包过程管理不严,极有可能造成重要数据泄密,对企业的发展壮大和日常工作开展造成影响。

2.2 外包工程师操作失误造成信息系统瘫痪

运维工程师技术水平良莠不齐,如不对外包工程师的运维操作进行严格规范,有可能由于操作不谨慎或误操作造成重要信息数据丢失、损坏,导致信息系统异常,甚至造成信息系统瘫痪,影响正常业务开展。

2.3 外包工程师在信息系统中植入病毒或预留后门

部分外包工程师由于利益驱动在信息系统中植入病毒或预留后门,方便其日后获取信息系统的各类资源和数据,造成信息系统运行隐患,甚至导致企业触犯国家相关法律、法规,给企业造成名誉或经济损失。

2.4 运维外包造成过度依赖

大量信息系统运维外包,造成企业内部信息化机构学习意愿下降,专业技术素养增长缓慢,发生突发事件且运维商无法及时到场,可能造成信息系统长时间停止服务,甚至长时间瘫痪,影响企业正常业务,给企业造成经济损失。

3 信息系统运维外包安全管理方法

针对信息系统运维安全隐患分析中提到的问题,我们从强化运维过程管理、加强操作风险管理、降低系统运行隐患、增强事件处理能力等四个方面进行分析,发掘出信息系统运维外包安全管理方法,用以提高信息系统运维外包安全管理水平。

3.1 完善制度管理,增加硬件保障,强化运维过程管理

(1)系统运维管理制度是信息系统运维外包安全管理工作的基础,只有拥有科学、完整、自成体系的管理制度,才有可能真正的做好信息系统运维外包安全管理工作,而制度的建立是一个长期的动态过程,即针对新的技术和管理要求要及时修订制度,将其纳入管理范畴,确保制度能够完全覆盖信息系统运维过程,同时认真落实制度,使其充分发挥规范运维商和运维工程师的作用,否则完善的制度仅仅是“一纸空文”。

(2)建立并认真执行安全事件惩罚机制,签订信息安全保密协议,加大对运维商运维过程中发生事故的处罚力度,提高运维商在出现事故后的处理成本,能够促使运维商主动加强对其人员的管理,减少信息系统运维安全事故的发生机率。

(3)引入运维安全管理类设备(如堡垒机),加强对运维人员运维过程的管理,该类设备能够全面记录运维操作、统一分配运维权限、细化管理访问范围和精确控制运维时效等方面的功能,属于信息系统运维事中管理和事后审计设备,充分利用该类设备的各项功能,对运维工程师运维操作情况进行有效规范、记录,确保对运维工程师的操作“有迹可寻”。

3.2 规范运维操作,拟定应急措施,加强操作风险管理

(1)运维工程师在进行重要操作(如数据库参数配置等)时必须出具书面告知书,经双方签字确认后方可进行操作,告知书中至少应包括操作内容、涉及信息系统、预计完成时间、可能出现的风险及风险等级预估。

(2)针对预估等级较高的风险应充分预估发生机率、影响范围等内容,拟定应急措施,确保及时解决。

(3)制定回退方案并预留充足的回退时间,针对运维过程中发生的不可预期或难以解决的问题,确保能够及时回退,保证信息系统正常运行。

3.3 测评系统安全,定期扫描漏洞,降低系统运行隐患

(1)运维工程师对信息系统进行升级后,及时聘请拥有安全评估资质的第三方进行应用系统安全评估,评估后出具有效的评估报告,依据评估结果要求运维商进行整改,直至所有问题被解决。

(2)定期对网络设备、服务器操作系统等进行漏洞扫描,有效防止系统被植入病毒或预留后门,针对新发现的漏洞及时联系运维商进行处理,确保信息系统安全运行。

3.4 提升业务素养,组织应急演练,增强事件处理能力

(1)通过专项业务培训、自主学习等方法,不断加强信息化工作人员业务素养,学习内容不仅包括数据库、信息化设备硬件维护等专业知识,还应包括管理学、统筹学、统计学等方面的知识,才能真正做到“管的高效、管的明白、管的合理”,才能促进信息系统运维外包安全管理工作朝着正确的方向发展。

(2)强化应急预案演练工作,定期组织信息化应急预案演练。演练前认真筹备,拟写演练方案,联系运维上进行应急演练技术支持;演练过程中严格按照方案进行演练,切实提高演练效果;演练后针对演练中发现的问题及时汇总、总结,逐步提高信息化工作人员处理突发事件的能力。

4 结束语

信息系统运维安全管理工作是信息系统运维工作的重要环节,做好此项工作,即能使得信息系统得到更专业、更良好的运维服务,又能最大限度的保证企业数据安全,系统稳定运行。

作者单位

运维管理篇8

关键词:运维管理体系 运维费 运维绩效 技术支撑体系

引言

目前,我国电子政务工作的重点已从大规模网络、平台、业务系统的建设阶段转向以深化应用、提升应用效益为主要特征的“运行维护”阶段。与此同时,建立完善的电子政务运维管理体系,将对发挥电子政务绩效、构建服务型政府、提供公共服务效益起到至关重要的作用。但负责运维管理工作的各级政府单位如何构建IT运维管理体系呢?下文以国家某部委IT运维管理体系为例,介绍IT运维管理体系建立的方法,以期对读者有所启示。

一、案例背景

某部委信息中心(以下简称中心)肩负着电子政务主干网建设、维护、运营的使命,致力于提供安全、高效、快捷的IT服务。近年来,随着信息化建设的深入,网上运行的业务应用逐步增加,计算机机房设备、网络基础设施,大型主机、服务器、客户端等硬件平台,政务应用系统、数据库、应用服务器、中间件等软件平台日益复杂,服务的用户(包括应用使用单位、人民银行、税务、海关、各银行等)越来越多,如何维护好日益增多的网络和系统等各类设备,保证各个应用系统安全顺畅地运行,为用户提供良好的服务以及时解决出现的问题和故障,做到网络和用户之所及,管理和服务之所及,是政务业务能否正常运行的关键所在。

中心目前还处于初级的IT运维管理状态,在组织结构、管理规范、管理流程和技术支撑方面,还没有构建一个综合的IT运维管理体系。对网络、设备、系统、用户等的管理和服务是分散的、不关联的,没有实现数据、信息和知识库的共享,没有实现规范化和流程化,因此,管理和服务是粗粒度、低效率的,这种管理模式将越来越难以适应政务信息化的发展要求。

因此,需要梳理运维管理需求、规范运维管理流程,开发和建设一套科学有效的融合组织、制度、流程、技术的IT运维管理体系(简称体系),从粗放和分散式管理,逐步过渡到科学、规范和专业化管理,使IT运维管理体系成为中心日常工作的重要组成部分,这不仅对政务核心应用系统顺利运行和应用有重要意义,也将为支持和推进政务改革提供管理和服务保障。

二、体系建设需求与目标

⒈体系建设需求

在组织人员方面,针对目前各处室分散运维的现状,中心迫切需要统一IT运维管理认识,整合IT运维管理资源,设计科学合理的IT运维管理组织结构和职责分工,建立起集中的运维管理模式。集中运维管理模式的建立,可以使中心从目前以技术为中心的管理模式转向面向业务、以服务为中心的管理模式,并通过对中心服务资源的统筹安排和共享使用,在服务环节上加强沟通协作,提高中心整体IT运维管理的有效性。

在管理规范方面,目前各相关处室在日常运维工作中没有规范的管理流程,中心迫切需要对目前IT运维工作程序进行规范和标准化,建立统一的IT运维管理流程,以适应业务用户对IT服务端到端的需求。同时,作为管理流程执行的保障手段,中心需要建立IT运维管理工作的管理控制点(如开发转运维的上线管理、运行监控管理、下线管理等)和覆盖全面的管理制度,并清晰定义IT服务的考核目标,按照管理流程、角色岗位进行分解,配套实施支持考核的技术手段,实现科学量化评价IT服务工作的效率和效果,促进IT服务工作的高效运行。中心管理层还提出制定运维费用标准的管理需求,使中心运维费用能够与信息化建设费用、日常公用经费区分,规范运维费预算的执行,保障运维工作有序开展,并能够基于预算执行结果,进一步指导中心的运维管理工作。

在技术工具方面,针对相关处室单从自身技术需要出发,分散自发使用局部功能软件的情况,中心迫切需要从业务和中心管理需要出发,制定一套用于从整体上指导运行维护工作的技术规范,采用业界成熟的专业工具来弥补现有工具手段的功能局限,建立一套统一完整的技术管理工具平台和相关技术支撑子系统;同时需要实现技术工具之间的集成与整合,逐步实现IT运维工作流程和监控管理的自动化。

综上所述,无论从组织人员、管理规范还是技术工具方面,中心都对目前的运维工作提出了迫切的改进和建设需求,希望能够从整体结构上考虑这三方面内容的有机结合,从而建立一套适应业务和管理成熟度的IT运维管理体系,高效支持业务的稳定运行与发展。

⒉体系建设目标

按照“制定科学有序的管理流程和规章制度,建立统一的运行维护、客户服务模式和规范,应用先进的技术工具,搭建统一高效的IT运维管理平台。IT运维管理平台包括信息展示、服务台、服务流程管理、知识库、集中管理与监控(机房环境管理、网络管理、安全管理、系统管理、存储备份管理、应用系统管理、客户端管理)等功能模块和子系统”的建设内容,中心IT运维管理体系建设的总体目标是:树立面向业务服务的IT运维管理理念,建立科学合理的绩效考核指标,由粗放管理向精细管理转变;实行集中统一的IT运维管理模式,由分散管理向集中管理转变;建立统一高效灵敏的IT运维管理平台,由无序服务向有序服务转变;建立规范标准的IT运维管理流程,由职能管理向流程管理转变;应用先进、实用、高效的IT运维管理工具,由被动管理向主动管理转变。

三、体系建设思路和方法

⒈体系建设思路

IT运维管理体系建设思路是:按照IT运维管理理论、方法和标准,结合中心实际和建设需要,遵循立足需求、统一规划、保障重点、分步实施、务求实效的原则,建立一套融合组织、制度、流程、人员、技术的IT运维管理体系,建立组织机构,制定规章制度,规范管理流程,明确职责分工,强化技术支撑,实现对网络及信息系统的综合管理监控和日常技术支持,快速响应和及时解决信息系统运行过程中出现的各种问题和故障,确保中心负责的部机关网络及信息系统正常、稳定、高效运行。

⒉项目开展方法

在整个项目过程中,项目组采取“协调式咨询方法”,确保中心IT运维管理体系项目的成功(参见图1)。

该方法论具有以下创新的优势:

⑴咨询、实施和产品三者独立,降低项目风险

引入外部专家作为独立第三方,负责梳理中心IT运维管理体系建设需求,从管理、流程、制度、组织与人员、技术选型等方面规划IT运维管理体系。

在实施阶段,实施厂商在规划的基础上,结合具体产品实施IT运维管理体系。外部专家顾问将全程参与后期运维管理体系实施的全过程,为集成实施提供管理服务和考核服务,设定实施里程碑和基线;定期对项目计划和阶段目标进行核查,保证项目的顺利如期完成,降低实施风险。

咨询、实施和产品三者独立,有助于降低IT运维管理体系建设项目的风险,最大效益地发挥中心IT运维管理体系的作用,开创适合中心需求的创新型IT运维管理之路。

⑵有利于从业务需求的角度和全局的高度对IT运维管理体系进行规划

该方法从中心业务需求出发,对业务流程进行分析和需求调研,分清重点和难点,排定优先级别,确保项目目的的达成;同时从全局的高度,构建融合人员、组织结构、流程、管理制度和工具的IT运维管理体系,最大限度地提高中心的效益和IT服务的改善。

⑶借鉴外部专家的经验,提升项目建设的效果

一方面,外部专家通过对中心IT运维管理现状的调研,结合业界最佳实践进行差距分析和评估,提出有针对性的规划方案,“对症下药”,从而保证项目目标的达成。另一方面,外部专家借鉴其在业内开展IT管理服务项目咨询的经验,以及国内外同类政府组织IT运维管理体系建设项目的最佳实践,作为本项目的参考,用以提升项目建设的效果。

⑷搭建交流平台,实现知识转移

外部专家在整个项目过程中对中心相关人员进行IT运维管理最佳实践和方法论的培训和咨询指导,搭建业务部门、信息技术中心、集成商、产品提供商之间的沟通平台,使各方在对项目目标和实施方法有统一的认知,以保证项目的顺利实施;另外,在项目后期,管理体系构建完成和系统平台建设完成后,外部专家还负责组织相关人员进行培训,实现知识转移和知识共享,培养IT运维管理的专业人才。

⑸外部专家对后续集成实施和产品选择的全过程进行项目管理和风险管控,持续优化管理体系

外部专家主持制定《中心IT运维管理系统需求说明书》,对体系架构和流程平台产品的各功能点进行详细的定义和说明,并针对目前业内流行的平台产品进行评测和比较分析,提供分析数据,为产品选型决策提供支持;同时,外部专家对项目的各个功能点的技术和开发风险进行评估和提供相应的解决措施,从而降低实施过程中的风险;此外,外部专家还将参与后期项目的产品选型和集成方案招投标工作,对集成实施和产品选型进行专家审定和把关,对各项投资进行预期的绩效评估,以确保将资金用于项目的关键点上,降低实施成本;在体系建设完成后,外部专家将定期分析业务需求,持续优化中心IT运维管理体系,对管理体系执行情况进行审计和提出改进建议。

四、体系建设内容

⒈体系架构

在项目实施过程中,中心以“体系化”的思路构建一整套行之有效的“持续改善机制”,面向业务和应用,以服务为导向,创建创新性的政府IT运维管理体系。

IT运维管理体系涵盖组织管理模式、制度规范体系、技术支撑体系等3个层面的内容(参见图2)。

⑴组织模式层

确定和规范IT运维管理体系运行的管理方式和与之相配套的人员岗位职责安排、机构设置,将IT服务相关的全部活动进行统一决策与规划,形成集中统一的IT运维管理机制,实现对客户的端到端服务。在集中统一的IT运维管理模式下,按照IT运维管理任务科学设置或调整组织机构,划分任务、角色、岗位,合理配置IT运维管理资源,达到人、工具、流程的有机融合。

⑵制度规范层

分别从管理与操作方面建立IT运维管理过程中各个参与要素(人、流程、工具)的行为准则与工作程序,从IT运维管理体系总体运行、流程执行和岗位职责3个层次建立考核评价体系,确定运维费用的组成与计算方式,规范运维费用的来源保障,实现IT运维管理的量化管理。具体内容包括管理制度的制定、管理流程的设计、评价考核体系的执行、运维费用的管理等。

⑶技术支撑层

建立面向业务客户的IT服务请求响应窗口和面向技术支持人员的体系运行管理窗口,建立负责IT运维管理流程运行的流程管理平台和负责IT基础设施和业务应用系统运行监控的集中监控管理平台,根据不同类型IT基础设施和业务应用系统的管理职能,建立技术管理子系统,建立知识库、配置库、报表及日常操作等共享支持子系统和为业务管理提供服务的业务运维管理子系统。

⒉体系建设内容

IT运维管理体系要真正发挥效益,避免“为技术而技术”,需要融合人、流程、技术。根据信息化的发展要求,配套的管理措施应包括组织模式、管理制度、管理流程、绩效考核、运维费用、技术支撑等内容。

⑴组织模式

中心从全局的角度定位IT运行维护和服务工作,将中心目前分散进行的各项IT运行维护和服务的工作职能逐渐整合,进行集中统一管理,统一调度IT运行维护和服务的技术力量,并结合中心实际情况和管理需要进行配套的组织机构的设置和逐步完善。

第一,成立IT运维管理领导小组。初期成立由中心领导和各处(室)负责人组成的IT运维管理协调小组,从总体上负责IT运行维护和运维管理的统一组织协调,监督检查各处室服务质量;后期根据IT运维管理发展,可以成立由部领导、中心领导和业务司局领导组成的信息化治理领导小组。

第二,建立面向用户的服务接口。初期以服务台为统一服务接口,不断扩充与完善服务台的功能,统一受理客户的IT服务请求,记录事件并进行一线解决,对解决不了的较为专业的事件派发给专业的二线技术人员,各相关处室提供二线技术支持,并明确相关技术支持人员及职责;后期逐步建立独立的IT运行维护和服务机构(运维中心),专门负责IT运维和服务工作,合理划分建设与运维的边界,实现建设与运维的分离。

第三,设置合理的组织机构。初期保持目前组织机构和职责不变,进一步理顺关系;后期随着信息化的发展和管理成熟度的不断提升,逐步建立起完全适应体系运行的IT治理组织机构。

⑵管理制度

管理制度是指IT运行维护和服务工作必须遵循的内部管理规定,用于提高工作的协调性和管理的有效性。借鉴IT运维管理体系国际标准ISO20000要求,结合中心实际,管理制度分为“总办法”、“分办法”、“实施细则或操作指南”和“配套表单”4个层次(参见图3)。

第一级:总办法。制定涵盖中心IT运维管理全过程的《IT运维管理办法》,作为指导IT运维管理工作开展的统领,其内容涵盖IT服务全过程的管理控制点和人员管理等核心内容,包括IT运维管理模式、归口管理、组织结构与职责、人员岗位与职责、IT运维管理工作规划与执行、预算保障、绩效评价等方面的管理规定。

第二级:分办法。结合IT服务的实际情况,针对管理工作需要而制定的具体管理办法,其范围涵盖系统、网络、机房、桌面、设备备品备件及耗材、文档等,明确管理职责与规范操作流程。

第三级:实施细则和操作指南。在第二级分办法的基础上,按照精细化管理需要,对某些方面的运行维护工作的具体实施过程与操作程序所做出的细化准则或指南。

第四级:配套表单。配合第一、二、三级制度的执行而配套制定的表单等,用于记录、备案人、物、行为等信息。

⑶管理流程

管理流程是指为达到既定的IT运维管理目的而组织起来的逻辑上相关的有规律性并可重复的活动。借鉴IT运维管理国际最佳实践ITIL,将IT运维管理分为服务支持和服务交付两大部分。根据中心的管理需要,分阶段建立相关流程。先期建立服务台和事件管理、问题管理、变更管理、配置管理流程。

⑷绩效考核

为实现IT服务精细化管理的目标,提高管理制度和管理流程的执行力,绩效考核是非常重要的管理手段。

绩效考核从中心IT运维管理体系的目标出发,按照体系、流程和岗位角色分解,形成“IT运维管理体系运行KPI关键绩效指标)――流程KPI――角色岗位KPI”3层相互关联的绩效考核指标体系(参见图4)。

⑸运维费用

运维费用是IT运维管理体系持续运行的资金保障。为保障业务应用系统的有效运行和IT服务质量的提高,实现IT服务精细化管理的目标,科学进行运维费用管理显得非常重要。

运维费用管理清晰定义运维费的构成要素,规范运维费用预算的口径和标准,使其与信息化建设费用、日常公用经费区分。在运维费预算的基础上,要按照中心财务制度规范运维费预算的执行,保障运维工作有序开展。基于预算执行结果,进一步指导中心运维管理工作,最终实现“运维预算――核算(预算执行)――结算”全过程管控。

⑹技术支撑

技术支撑体系包括3个层次:展示层、流程及业务运维管理层、集中监控层。

展示层。提供对用户的IT运维管理界面与对技术人员的体系管理控制界面,在运维管理界面上实现集中运维的统一管理功能和信息展示与交互功能。

流程及业务运维管理层。在集中运维管理模式下实现流程执行和管理控制功能、业务运维管理功能。

集中监控层。通过监控工具实现对不同服务对象和IT资源的实时监控,包括主机、数据库、中间件、存储备份、网络、安全、机房、业务应用(以下简称“应用”)和客户端等技术支撑管理子系统,并通过集中监控管理平台对不同被管对象的技术支撑管理子系统进行综合处理和集中管理。

五、体系建设的效果分析

在借鉴IT运维管理国内外政府机构最佳实践的基础上,结合中心实际,通过建立科学合理的IT运维管理体系,系统地将组织架构、管理流程、管控制度、绩效考核、运维成本核算以及技术平台贯穿融合,有效解决了目前运维工作中面临的沟通不畅、效率低下、服务质量无法保障、被动救火等问题,改变过去“各自为政”、分散运维的状况,增强为业务应用服务的意识,更好地实现建设服务型组织的目标。以服务请求和故障解决为例,体系建设前后对比如图5、6所示。前者服务接口不统一,关联关系繁杂,服务过程无人最终负责,没有真正面向用户提供“端到端的服务”;后者关联关系简单明了,服务接口统一,实行“一站式服务”,服务全过程跟踪,面向用户提供“端到端的服务”。

中心运维管理体系建设完成后,带给信息化主管领导和中心领导、业务用户、中心工作人员多方面的好处,具体体现在以下“三个放心”。

⒈“领导放心”(带给信息化主管领导和中心领导的好处)

第一,提升信息化的效益。“三分建设,七分管理”,信息化80%的效益体现在运行维护阶段。IT运维管理体系的建设,将进一步规范运维管理工作,降低IT运维成本,通过“用好信息系统”,更加有效地支持业务和提供公共服务,进一步推进业务工作公开、透明。

第二,降低信息化的风险。通过开发与运维职责分离,对权限进行合理分配,避免“篡改数据、内外勾结”等风险发生,规避了系统性风险;通过规范化的操作,减少人为错误引发的风险;通过主动监控和趋势分析,预防事故的发生;通过对重大变更的审批和授权,减少了因变更不善导致的风险;通过制定应急预案,减少重大故障的影响。“IT运维”将不再是“黑箱”,将变得可管可控,降低了信息化带来的风险。

第三,支持领导宏观决策。建设的IT运维管理系统,能够记录并分析运维过程中发生的各种故障及其解决方案,通过报表工具,展示全局视图,让领导了解运维工作各方面情况,支持领导宏观决策。

第四,提升信息化科学管理水平。面向业务,以业务需求和目标为出发点,制定IT运维管理的愿景、目标和策略,建立科学的IT运维管理机制和治理型组织结构,理顺组织机构和职责划分,规范IT运维管理过程中各个参与要素(人、流程、工具)的管理制度与工作流程,建立绩效考核评价体系,规范运维费用,实现精细化管理和提升信息化科学管理水平。

⒉“业务用户放心”(带给业务用户的好处)

第一,进一步规范用户行为。IT运维管理体系的客户端管理系统,通过批量进行软件分化和补丁安装,有助于提高客户端管理的效率和效果;通过监控客户端,有助于规范用户使用计算机的行为(如非法下载或安装程序、内网非法外连等),有效避免信息泄露和信息安全事件发生。

第二,提升服务质量和服务感知。IT运维管理体系的服务台,面向用户,统一受理服务请求,实行“一站式服务”;通过服务台开通的用户服务网站,用户可自行查询服务请求所处的状态或查询知识库进行自主服务;通过持续优化服务流程和服务水平,IT运维管理体系提高了业务的用户满意度,进一步提升中心IT服务的整体形象。

⒊“工作人员放心”(带给中心工作人员的好处)

第一,主动监控和预防故障发生。应用先进、实用、高效的IT运维管理工具,中心运维工作人员可以实时监控各系统的运行状态。当系统超过设定阀值自动报警时,通过系统间的关联分析,工作人员可以主动发现并解决故障;并通过趋势分析,寻找潜在故障,防患于未然,改变“被动救火”的局面,更加有效地防范故障和提高工作效率,有效地支持业务工作的顺利开展。

第二,提升中心工作人员的专业化水平。实行建设与运维的专业分工,通过在中心层面的资源整合,不断积累知识库,加强处室间、工作人员间的沟通和协作,传承和共享成功经验,提升中心工作人员的专业化水平,促进信息化工作向专业化方向发展。

参考文献:

1.李长征.中国IT服务管理现状分析与发展趋势[EB/OL].(2008-6-17)[2008-11-25).省略.cn/new_itgov/article/20080617_135747_3196770.shtml

2.孙强,左天祖,刘伟.IT服务管理:概念、理解与实施[M].北京:机械工业出版社,2004

作者简介:

李长征,男,ITGov中国IT治理研究中心研究员。国务院国资委、劳动和社会保障部信息化管理师高级培训班特聘讲师,北京大学研究生班特聘讲师;研究方向:IT治理、IT服务管理、电子政务、运维管理、绩效管理和风险管理等。

上一篇:信息系统范围管理范文 下一篇:时尚管理范文