信息系统应急演练总结范文

时间:2023-02-21 16:14:55

信息系统应急演练总结

信息系统应急演练总结范文第1篇

【关键词】银行信息系统 应急演练 综合评价方法

一、概述

随着我国金融市场不断发展,信息系统建设已成为商业银行核心竞争力之一,信息系统安全直接关乎商业银行自身利益,甚至影响国家金融安全和社会稳定。要确保信息系统安全稳定运行、保障业务连续性,就必须不断加强商业银行信息系统应急管理,提高应急能力。作为应急管理的重要环节,应急演练能够全方位检验商业银行应急管理能力,验证应急预案有效性、应急资源完备性及应急人员的适应性。

鉴于此,国家相关部门、各商业银行高度重视信息系统应急演练工作,银监会对银行业信息系统应急演练提出明确要求,涵盖演练范围、组织保障、优化改进等多方面[1];各主要国有行业银行、股份制商业银行及各地方银行,都定期开展分重点、分层次、分系统、分阶段的信息系统应急演练工作,查找问题,提高处置能力;苏忠运对大型国有商业银行一级分行信息系统应急演练工作方法进行探讨,提出应急演练策略、工作要求和工作评价方法[2];王钢对金融信息系统应急演练中的信息管理、资源共享、预案更新等问题进行研究,提出分级响应策略等[3];任长清将银行灾难恢复应急演练分为预警、启动、恢复、解除和回切等五个阶段,提出灾难恢复组织、指挥机构、实施原则、演练案例、演练方案和演练培训等六个重要事项[4];任长清还提出三点估算法,对商业银行灾备组织人员的到位时间进行评估[5]。综上所述,业内专家和学者在商业银行信息系统应急演练方面,已开展大量的工作,但这些研究仍存在进一步改进的地方和问题,如应急演练组织有待进一步细化、应急演练结果评价量化等。

二、组织流程

商业银行信息系统应急演练组织流程如图1所示,主要包括准备、演练、总结等3个阶段。在准备阶段,根据演练总体要求及各商业银行信息系统现状,做好人员构成、演练范围、流程规划、演练环境、故障场景、技术保障等方面的准备工作,做到安全可控前提下,确保尽量逼近真实[2];在演练阶段,首先由应急值班人员向应急人员系统预警,通知人员到处置现场进行集结,人员集结后由技术专家向其宣布故障场景,处置人员根据故障场景,按照日常应急预案进行应急处置,处置过程中,考评小组对处置流程、处置方法、处置结果等进行量化打分,并形成演练评估报告;在总结改进阶段,要对演练过程、演练结果进行深入总结分析,形成总结报告,对参加演练的应急处置人员进行表彰或提出改进意见,根据演练效果对应急预案做进一步优化。

图1 应急演练组织流程

(一)准备阶段

作为应急演练的组织方,在筹备演练过程中,首先要根据相关法律法规、规章制度以及银行内部相关规定、管理办法,综合参考信息系统应急预案,拟定应急演练工作方案初稿,同时召开应急演练讨论会,听取管理、业务、安全及技术等部门的意见,形成应急工作方案,报上级领导审批同意后形成正式的应急演练工作方案,下发相关干系人。应急演练工作方案要明确演练组织机构、时间地点、参与人员、应用系统、演练流程等要素,明确分工,明晰责任。

构建高效的、完备的组织结构(表1)是演练成功的关键因素,通过高层领导推动演练资源准备、实现演练权威性,通过技术专家确保演练演练有效性和可靠性,通过设立工作小组实现演练有序开展,达到演练目标。

表1 应急演练组织结构表

相对机房环境、网络、操作系统等方面而言,由于银行业务种类繁多,各信息系统之间应用逻辑复杂、关联性强,应用级应急演练更具紧迫性。在众多应用系统中,要选择以下三类应用系统作为演练的“故障”系统:(1)关键业务系统(2)近期有重大变更的系统(3)近期出现生产问题的系统。

评估小组根据应用系统历史问题、关键程序、关键路径制定演练场景,演练场景是各应用系统的“故障”描述,详细记录应用系统故障时间、故障部位、故障状态、故障表现等,这些应用场景所描述故障一旦真实发生,将极大影响生产安全,甚至对业务造成重大影响。同时为确保安全可控,演练场景和相应处置方式对生产不能造成实质性影响,可采取的策略包括:系统维护时间窗口、交易量相对较少时间段、利用备份环境。

技术准备方面,在参加演练人员多、涉及环节复杂情况下,可采用应急短信作为应急通讯方式,及时高效发送应急集结、应急处置通知。应急短信可采用企业专有短信号码,通过批量短信发送工具发送,应急人员通过短信进行反馈,由信息系统进行智能统计,形成报表。演练环境方面,设立演练各组织结构场地标示,通过投影等方式及时将处置现场传输到指挥中心。

(二)演练阶段

1.系统预警和人员集结。为全面检验应急资源的就绪状态,尽量做到演练突然性,尽量接近真实状态,应以系统故障来通知各应急人员尽快赶到故障现场进行应急处置。应急通讯畅通、及时响应能力是应急工作的重要组成部分,需作为演练考评指标之一,由评估小组详细记录各应急处置人员的响应时间(表2)。在演练开始后,通过“公告板”等方式实时通报演练进展,营造应急处置的严肃、紧张氛围,逼真模拟故障现场。

2.应急处置。应急人员抵达演练现场后,由技术专家向其说明预设的故障场景,按相关要求进行及时处置。评估小组的技术专家要全程观察应急处置过程,判断应急处置是否符合应急预案要求,是否对生产系统产生影响,并采取及时有效措施避免生产事故。在应急处置后,评估小组按照事先拟定规则,对各应急处置模块进行量化打分。

表2 应急演练各项指标记录表(样例)

3.演练评估。演练结束后,评估小组对演练进行综合评估,应急演练综合评价方法(Emergency Drill Comprehensive Evaluate Method,EDCEM)就是评估小组对应急演练中的各关键项进行综合评价,通过EDCEM可以得到演练评价结果(Emergency Drill Indicator,EDI),其计算方法如式1所示。其中,xi(xi>0)为各指标项的指标值,响应时间、集结时间、处置情况等;ψi(0?燮ψi(xi)?燮1)为指标值量化关系函数,如对响应时间进行量化,1分钟以内为100,超过1分钟为50,超过2分钟为0;(0?燮ω■?燮1,■ω■=1)为各指标项在评价结果中的权重,权重越大,其在评价结果中所起作用越大。

EDI=100×■ω■Ψ■(x■) (式1)

(三)总结阶段

评估小组对应急演练进行综合评估并报应急领导小组同意后,公布考评结果。由应急领导小组将对演练进行全面总结,对演练整体情况进行点评,对在关键方面(如集结时间、处置时间等)表现较好的人员、部门进行表扬,对存在不足之处提出意见。在演练结束后,工作小组要对演练总结形成问题跟踪表,及时跟进各部门改进不足之处,保障生产安全。

三、实践

某商业银行(下称“A行”)为大型国有商业银行,A行软件开发部门(下称“该部门”)现有员工1300余人,每年承担200多个应用项目研发,还承担几百个业务系统的运维保障工作,在信息系统应急方面具有重要作用,由于涉及人员多、系统多、机构多,该部门的应急演练主要验证应急组织协同性和应急流程的有效性,确认应急联络畅通性和应急集结时效性,提升应对突发事件的应急响应与处置能力。

近期,该部门组织开展了重要生产系统应急演练,依据事先制定的《重要生产系统应急支持工作规程》并结合有重要变更、容易出现生产问题来选择参加演练的应用系统,演练由该部门负责人现场全程主持,A行风险管理部门、科技主管部门相关负责人作为观摩小组成员参加演练,相关技术骨干作为应急人员具体实施应急处置工作,技术保障部门相关运维骨干根据应用系统历史问题并综合近期运维重点制定预设应急场景,相关部门一线管理人员、技术骨干组成评估小组和工作小组,承担演练综合评价、组织协调工作,参加演练的领导和技术人员超过50人。演练中,各项应急处置工作均能按照应急方案正确开展,达到相关应急处置规定要求,演练取得圆满成功。

据统计,演练中各系统应急处置人员通讯顺畅,平均集结时间为18分钟,达到应急处置关于时间的规定要求,部分应用系统由于人员配置不合理、距离较远、交通拥堵等客观原因,在接报后超过30分钟抵达处置现场,同时还有个别人员未及时响应应急电话,鉴于此,演练工作小组形成信息通报,督促对相关系统应急处置人员做适当调整,以符合应急处置时间规定,进一步加强应急意识,避免此类事情再次发生。

四、总结

本文对银行信息系统应急演练组织流程进行讨论,提出应急演练综合评价方法,并在大型商业银行应急演练中进行实践,验证应急组织协同性和应急流程的有效性,提升应对突发事件的应急响应与处置能力。本文所提出方法在部门级(一级部)进行实践,应用范围有待进一步扩大,其通用性、规模性还有待加强,同时由于管理、业务和技术等方面的原因,涉及全行的模拟真实故障的应急演练较难开展,应急演练组织方法的进一步研究存在困难。

参考文献

[1]中国银行业监督管理委员会.银行业重要信息系统突发事件 应急管理规范(试行).2008年04月23日.

[2]苏忠运.分行信息系统应急演练工作方法探讨[J]中国金融电脑,2005(05):32-33.

[3]王钢.金融信息系统应急响应及演练[J]计算机安全,2009(08):75-78.

[4]任长清.银行如何开展灾难恢复应急演练[J]中国金融电脑,2007(1):19-21.

[5]任长清.商业银行灾备组织人员的到位时间评估[J]中国金融电脑,2009(2):39-40.

信息系统应急演练总结范文第2篇

【关键词】业务连续性管理体系 业务影响分析和风险评估 矩阵模型分析法

一、引言

2011年银监会向全国商业银行等金融机构下发《商业银行业务连续性监管指引》(银监发〔2011〕104号,以下简称:《指引》),从业务连续性组织架构、业务影响分析、业务连续性计划与资源建设、业务连续性演练与持续改进、运营中断事件应急处置等几个方面指导国内金融机构建设业务连续性管理体系。自发文以来,国内银行一直根据监管的要求建立符合自身发展的业务连续性管理体系,然而,业务连续性管理体系的建设涉及面广、建设周期长,从“软件”方面来看,涉及现状调研、方案及计划制定、业务影响分析和风险评估、重要业务范围界定、制度建设、总体和专项应急预案建设、演练等内容,从“硬件”方面来看,涉及数据中心及灾备中心建设,需要大量的资金及时间等资源的投入,虽然《指引》发文已5年有余,但极少数银行可以完全按照监管的要求建立全面健全的业务连续性管理体系。

本文以某银行业务连续性管理体系建设为研究背景,总结业务连续管理体系建设过程中的重点及难点并提出解决思路,为国内银行同业提供参考方法。

二、业务连续性管理体系建设重、难点解决措施

在业务连续性管理体系建设实践中,组织架构、业务连续性计划、业务连续性应急预案等工作实施难度较低,难点在于业务影响分析、总分行资源建设、业务连续性演练等工作,本文着重介绍上述难点的建设过程。

(一)业务影响分析

业务影响分析的主要目标是帮助银行通过识别和评估业务运营中断造成的影响,明确业务连续性管理重点,根据业务重要程度进行差异化管理,制定不同业务的恢复目标、恢复次序、确定支持重要业务对应的信息系统的恢复目标,其主要工作包括2个方面的内容,一方面是现状调研,另一方面是业务影响分析和风险评估。

在现状调研阶段,由于该项工作涉及全行所有业务以及大部份部门,可采取培训、访谈、召开研讨会、调查问卷等方式,逐步推进工作开展,初步梳理出重要业务清单。

在业务影响分析和风险评估阶段,结合国内外先进实践经验,采取财务影响和非财务影响两个维度对初步梳理出来的各项业务进行风险评估。财务影响和非财务影响均采用评分制,其中,财务影响主要评估该项业务中断一个工作日给银行带来的收入损失,可根据银行自身业务收入水平设置分值,该项指标是较为客观的估值;非财务影响则综合评估该项业务中断可能给银行带来的影响,如:监管负面影响、声誉损失、客户负面情绪、投资者信心/忠诚度降低、法律/诉讼风险、国家金融秩序稳定等,该项指标具有一定的主观因素,为避免主观因素影响程度过大,可采取两种方式降低影响:一是扩大调查问卷的样本量,二是对非财务影响的各个要素设置权重值,对财务影响及非财务影响设置综合评分规则。特别地,对于后台运营类、渠道类业务(比如:自助银行业务),虽然不直接产生业务收入,但它是其他业务产生收入的必要条件之一,对于此类业务计算该渠道所承载的各业务种类收入之和作为该渠道的业务收入。

在确定各项业务的财务影响和非财务影响指标基础上,采取矩阵模型分析法进一步确定业务恢复的优先顺序。在确定业务恢复的优先顺序的基础上,进一步确定该业务对应的信息系统恢复目标,以指导关键信息系统的资源建设。《指引》要求,“原则上重要业务的RTO不得大于4小时,重要业务的RPO不得大于半小时”,在信息系统资源建设中,关键信息系统的恢复能力应满足重要业务RTO、RPO的时效要求。

(二)总、分行资源建设

业务连续性资源建设属于“硬件”设施范畴,主要涉及总行同城、异地灾备中心以及分行机房设备的建设。

在总行层面,同城、异地灾备中心应建立重要信息系统的备份,在日常工作中应加强对灾备中心机房的巡检,确保系统正常运行。在分行层面,应从供电、网络、系统建设等方面实现全方位的应急措施,比如在供电环节,分行除配置双线路供电外,还要配备不间断电源(UPS)和应急发电机;在网络连接环节,不仅要配置不同运营商的网络线路,还要配置无线设备,确保在极端情况下仍能保障重要业务持续运营。

(三)业务连续性演练

虽然《指引》对国内商业银行开展业务连续性演练的具体方式未作硬性要求,许多银行在演练环节采用较为简单的桌面演练以应付监管的要求,这种方式虽然成本较低,但效果不好,难于检验应急预案的可行性,在实践中,某银行根据业务重要程度有针对性地对重要信息系统开展实战演练,在业务量较小的时间段将生产系统切换至灾备中心系统上运行,平时不断总结经验,实践证明,这种方式能够较好地应对突发状况。另外,许多银行在开展应急演练时,未要求业展亓方参与,《指引》明确规定,“商业银行应当将外部供应商纳入演练范围并定期开展演练;同时,应当积极参加金融同业单位、外部金融市场、金融服务平台和公共事业部门等组织的业务连续性计划演练,确保应急和协调措施的有效性”,因此,在开展应急演练时应将关联第三方纳入演练范围,注重演练的实质而非形式。

三、结束语

本文根据实践经验,对商业银行业务连续性管理体系建设过程中的重点、难点提出建议和方法,在业务影响分析环节提出按照财务影响和非财务影响来区分重要业务的分析方法,为梳理出业务恢复优先顺序提出矩阵模型分析法,实践表明,可顺利、高效地完成业务连续性管理体系的建设,有效降低重要业务中断风险,提高业务风险应对能力,满足《指引》对商业银行建设业务连续性管理体系的要求,对国内银行建设业务连续性管理体系具有参考意义。

参考文献

[1]中国银监会.商业银行业务连续性监管指引[Z].

[2]刘杰.银行业务连续性管理体系建设方法研究[J].时代金融,2014(2).

[3]吕峻.商业银行业务连续性管理问题探析[J].时代金融,2013(11).

信息系统应急演练总结范文第3篇

一、征管信息系统运行的有条件性和应急管理

CTAIS2.0江苏优化版综合征管系统是支撑我省国税部门税收征管工作运转的基础性业务处理平台,也是各类外挂系统(网上申报系统、电话申报系统、网上认证系统、一窗式票表比对系统、税银库联网系统等)进行信息交换的重要依托。我们认为,征管信息系统的正常运行依赖于外部运行环境、内部运维管理和硬件设备自身的稳定性三大类因素,这三大因素的有条件性就构成了征管系统正常运行的主要风险及其类型。

1、制约征管系统正常运行的外部因素

(1)电力供应和网络连接。由于运营商的原因或雷击等自然灾害造成断网、停电、电信故障,导致系统无法启动运行。

(2)恶意攻击导致系统运行故障。如黑客非法访问和入侵系统,窃取口令、拒绝服务攻击、越权访问,假冒、篡改或删除系统信息等。

(3)网络病毒造成系统运行故障。

2、制约征管系统正常运行的内部因素

(1)系统运维的滞后。相关政策法规调整后,相应系统“补丁”下发及江苏并版的滞后影响系统对部分征管业务的及时处理。

(2)网络技术更新、业务流程的变更等。在进行升级和数据转换时,可能会出现系统运转缓慢甚至死机现象。

(3)内部人员的错误操作。这些错误包括缺乏数据安全和网络安全意识,违反规定在工作机上浏览公共网站,未能按要求及时升级安全软件和及时查、杀毒,部分系统用户的密码设置过于简单、保密性差甚至公开化,使系统面临被“合法”入侵的风险。

3、制约征管系统正常运行的硬件设备自身因素

这主要是指计算机、网络等硬件设备在使用过程中出现的物理故障或由于网络技术自身缺陷造成的软件故障,以及计算机硬件设施提供的处理能力不足(如同一时间内集中的数据查询等大规模的数据请求超过系统的承载能力)导致征管系统出现瘫痪、死机、信息交换迟缓甚至中断等现象。

应该说,上述影响征管系统正常运行的因素是客观存在的,这就意味着我们赖以开展工作的征管信息系统出现突发障碍的可能性也是客观存在的,虽然其发生的概率不高,但决不应该被我们所忽视。

征管系统的故障,往往具有突然性、紧迫性、广泛性、连续性和持久性等特点,通过技术维护消除系统障碍必然需要一定的时间,在这一时间段内,我们的征管工作的有序性会受到冲击,其范围可能是部分地区也可能是全省,其内容可能是部分业务也可能是全部业务,其持续时间可能较短也可能较长。因此,有必要建立应急机制,通过一系列的制度建设,使征管机构在面对系统故障时有高效的组织架构;通过不断完善应急预案,使征管工作在面对系统故障时有可遵循的规范;通过必要的模拟演练,使征管人员在面对系统故障时有充分的心理和技术准备。

建立和运用这个机制的过程可称为税收征管应急管理(简称应急管理),定义为:面向征管信息系统可能或已经出现的突发故障,对税收执法或纳税服务的全过程进行的预先或适时的控制,是税收征收管理和信息化建设对信息系统突发故障的一种响应,是现阶段税收管理在这种突发故障背景下的理论延展。这一概念的内涵在于:应急管理重点是考察信息系统突发障碍对于征收管理的影响,并进行响应。开展应急管理,既是保障税务机关依法履行职责的需要,也是提高服务能力、维护纳税人合法权益的需要,更是税收征管和信息化建设不应或缺的内容。

二、应急管理的原则

应急管理所要规范的是一种特殊情况下的税收征管活动,其根本目标是确保税务机关在暂时失去征管信息系统支撑的情况下能够依法履行职责,并向社会提有效率的纳税服务。据此,它应遵循以下原则:

1、分级分类管理

从纵向看,根据信息系统故障影响的地域范围不同,可将应急响应分为三级,即全省范围为一级,省辖市范围为二级,县(区)范围为三级;从横向看,根据信息系统故障影响的业务事项范围的不同,可将应急响应分为三类,即影响所有业务操作的为一类,影响税收执法和纳税服务的为二类,只影响内部管理事项的为三类。以省辖市级为例,当全市范围内出现信息系统因故障不能支撑其接受纳税人电子申报时,即可由其本级决定启动“二级二类”应急响应,并实施相应预案。

根据国税机关税收业务的特点及征管信息系统的实际,按照故障的可控性、对征管业务的影响程度、持续时间和影响的地域范围等因素,将可能出现的信息系统故障及其影响作科学的分级和分类,有利于各级国税机关“各就各位”开展应急管理,制定不同的预案,提高应急工作的针对性和效率,形成全省完备的应急体系。

2、规范执法

在应急状态下,征管工作暂时失去了信息系统的制约,但税收法制的要求不应降低,制定应急预案应坚持法制原则,实施具体的应急措施应确保规范操作。这里有两层含义,一是面对纳税人的行政执法行为要规范,各类数据的采集要有依据,程序要合法;二是要满足执法监督的需要,对应急状态下由手工处理的征管业务,应制定各种相关的台账和表格,要求逐笔登记,便于系统恢复后的数据补录。

3、服务优先

确保各级国税机关的各项纳税服务措施不因征管信息系统的故障而中断,确保纳税人到国税机关办理各类涉税事项如税务登记、资格认定、税款申报、代开发票、购领发票等不因此而受到影响,是应急管理的主要目标。因此,预案的设置要体现服务优先的原则,一是要将处理涉及纳税人的涉税事项作为预案的主要内容,使应急状态给纳税人造成的影响减至最小;二是要在各基层单位预留必要的表、证、单、票等,确保应急状态下的人工操作可以随时响应;三是要以方便纳税人为主做好应急状态下的办税场所的分布和设置,制定维护办税场所公共秩序的措施,坚决预防可能出现的等待、拥挤带来不良事件。

4、协同高效

以流程为导向的CTAIS2.0江苏优化版将征管活动的各个环节连接成一个有机的整体,当信息系统出现故障时,这种纽带作用将暂时消失,在这种情况下,如何建立各工作部门、各工作环节及各工作人员之间必要的联系,继续保持征管工作的有序进行,是应急机管理所要实现的又一个目标。这就要求在应急状态下,首先要有一个明确的指挥中心;其次,各部门及人员要有新的、不同于常态的职能定位;最后,还要制订详细的业务办理流程。

三、应急管理的主要内容

从全省范围来看,虽然也有部分地区开始涉及这项工作,但仍比较零散,更没有形成全省统一的标准和体系。因此,在全省范围内着手开展应急管理,既是应对潜在风险的现实工作的需要,也是完善我省国税系统征管制度体系的需要。当前,主要应围绕“一案二制”来开展这项工作,即制订应急预案、建立管理体制、形成工作机制。

1、制订科学的应急预案

这里的应急预案,是指各级国税机关针对可能发生的税收征管信息系统突发故障,为迅速、有效、有序地继续履行法定职责、实施税收执法和提供纳税服务而预先制定的方案。它是用以明确在信息系统突发故障的事前、事发、事中、事后的各个进程中,谁来做、怎样做、何时做以及相应的资源和策略等的行动指南。

(1)预案体系的构成。按照分级分类的原则,首先,省局、市局和县(区)局应分别制订各自的预案,以应对不同地域范围内的应急需要;其次,省局、市局和县(区)局应根据信息系统可能的故障对涉税事项影响的不同内容和紧迫性(如是否处于税款申报期)制订不同类型的预案,以适合不同的需要;最后,下级预案要以上级明确的要求和标准为依据,上级预案要以下级预案的内容为基础,从而最终形成适应不同层级、针对不同问题、涵盖所有业务、相互补充、有机协调的应急预案体系。

(2)预案的编制过程。如图所示,我们将预案的编制过程分为三个阶段:

第一阶段:预案的准备

这是编制预案的前期工作阶段:①成立预案编制小组;②收集资料,对影响信息系统正常运行的危险因素进行辨识、分析和评价;③对本级组织的应急能力与资源进行评估;④制定预案编制计划。

第二阶段:预案的编制

主要工作有:①按计划编制预案;②预案的评审及修改;③本级领导批准并报上级机关备案。

第三阶段:预案的演练(实施)与修订

预案编写完后的主要工作有:①宣传;②培训和演练(实施);③修订和完善。

需要强调的是,管理学界认为,应急管理是一个独立的理论体系,开展这项工作必须要掌握一些关键技术。因而,科学地编制预案,就不能仅仅立足于经验、调研资料和主观想象。应急管理的技术主要有鲁棒计划建模与求解、约束满意决策、对应急系统初始状态的处理、决策支持系统设计等,这里简要介绍鲁棒计划的建模与求解。

鲁棒性(robustness,健壮性)指控制系统在一定(结构,大小)的参数摄动下,维持某些性能的特性,它是在异常和危险情况下系统生存的关键。由于税收管理也可被视为一个控制系统,因而尽管鲁棒性一词来源于工程技术领域,但将其扩展到税收管理领域仍有益处。鲁棒计划包含两个层次的含义,一是在突发事件发生之前所制订的各项计划和决策都应充分考虑环境的不确定性,制订具有健壮性的计划与决策,包括制订应急预案;二是突发事件发生之后,采取的措施应能适应一定参数的变动范围,采取的措施应尽可能在较大的参数波动范围内有效。鲁棒计划的关键在于如何确定目标或约束函数,使最终得到的方案在参数扰动情况下满足稳定性的要求。这里涉及到很多半结构、非结构性、非线性等问题,需要设计相应的算法进行模型求解。

(3)预案的主要内容

应急预案实际上是标准化的反应程序,以使应急工作能迅速、有序地按照计划和最有效的步骤进行,它至少应包括以下内容要素:①监测:通过危险辨识,采用技术和管理手段掌握信息系统运行状态,对事故发生的可能性进行预测;②响应:发生事故后,明确响应的原则、主体和程序,明确指挥协调、紧急处置的程序、部门和内容;③处置:一旦发生事故,具有应急处理的方法,能快速响应,履行法定职责,提供纳税服务;④保障:是指为保障应急处置的顺利进行而采取的各种保证措施,包括足够的办税人力、符合规范要求的办税文书及单证、必要的办税场所、秩序维护办法、通讯与信息、社会沟通、技术支撑以及其他保障。⑤善后:是指应急状态结束后,为使征管工作恢复常态所采取的一系列行动,包括文书归档,向信息系统补录数据等。

2、建立高效的应急管理体制

根据税收征管的属地原则和征管信息系统的“省级数据集中”这一特点,应急管理以“省局主导、各级共管、综合协调、分工负责”的体制为宜。

(1)省、市、县局是管理主体。首先,省、市、县局分别是本行政区域内应急工作的主体,各自制订相关的制度、预案、决定进入应急工作状态并对应急工作的后果负责。在这里,省局应承担主导作用,制定全省统一的标准、要求,切实推动此项工作的开展;其次,下级局的应急管理必须以上级局的标准和要求为依据,上级局要将下级局的应急管理视为本级的有机组成部分;最后,应急状态的进入由本级决定,但应及时报告上级局,上级局应从技术、物资和人力等方面给予支持。

(2)征管部门综合协调。各级征管部门在应急管理中要承担综合协调任务,一是要建立应急管理制度、制订应急预案、组织开展应急演练;二是在应急状态下要协助领导落实预案,适时掌握和控制预案执行效果,确保征管工作有序进行;三是应急状态结束后,负责督促文档的归集和系统数据的补充录入。

(3)各个部门分工协作。在应急管理工作中,各部门都应树立责任意识,税政部门要明确应急状态下的税收业务工作标准;计统部门要提供应急状态下需要手工填写的表、证、单、书;宣传部门要做好与社会舆论的沟通;其他还有做好应急状态下的人力调配,将应急管理列为日常干部教育培训的内容等等。

3、形成严密的工作机制

应急管理工作机制,就是要规范在信息系统突发故障的发生、发展、结束等整个过程中,应急工作的组织和各部门相互协作的工作方式。形成应急工作机制应从以下几个方面入手:

(1)建立制度体系。这些制度的内容要涵盖应急工作的组织指挥、应急状态启动和结束的审批程序、信息系统突发故障的报告、应急工作进展情况的通报、应急业务的指导、监督和检查等应急管理的全过程。

(2)加大考核力度。应将应急管理列入各级各部门、特别是各级领导干部的岗位职责加以考核。对应急管理工作开展的好的地区要给予表彰,并及时总结经验、加以推广。对不按要求开展应急管理,特别是在应急状态下组织不力、造成严重后果的,要追究责任。

(3)开展预案演练。国务院信息化工作办公室出台的《重要信息系统灾难恢复指南》中明确,“应急演练就是用于训练人员和提高灾难恢复能力的活动”。国税系统开展应急预案演练,目的就在于确保各级各部门充分熟悉和了解应急工作的策略、组织结构、人员角色及流程,同时验证其正确性和有效性,发现潜在的问题,持续完善和优化,进而提高全系统的应急处理能力。演练方案要有针对性,应该详细地描述应急演练的背景、目标、时间、参演人员、范围、演练计划、流程、演练对正常业务的影响及风险分析等内容。演练的过程应包括:模拟某类信息系统故障、应急指令、应急人员及物资到位、实施应急预案、系统恢复指令、按预案向系统回录数据、验证业务处理与数据的正确性、演练结束。

信息系统应急演练总结范文第4篇

【关键词】网络设备 主动运维服务能力 双机切换演练 数据中心

1 网络设备切换演练的工作描述

1.1 工作方案制定

数据中心阶段性的开展信息系统切换演练,其中包括硬件、软件、基础设施,网络设备切换演练即是其中一项重要内容。由于网络设备属于基础设施范畴,是信息系统的数据传输的经脉,影响面广,因此,这项工作的开展准备工作成为重中之重,网络运维团队精心研究切换演练工作的具体内容、范围、方案以及具体实施步骤,严格把关每一个环节,做到切换演练工作开展时不慌、不乱、沉着、按部就班。

网络设备的切换演练,与网络架构、具体设备戚戚相关,针对不同的网络架构、不同的具体设备,设计出标准的基线方案,针对牵涉业务系统的不同,制定完善相关的演练方案及实施步骤。目前数据中心网络设备种类多、品牌杂,包括路由器、交换机、负载均衡器防火墙等,每一种类网络设备品牌多达数种。网络设备的切换演练可以划分为多次实施,划分区域、划分设备、划分业务系统。根据方案设计思路收集设备信息、理清网络拓扑、梳理业务、应急方案、备品备件以及厂家支持等,诸多准备工作保障切换演练工作顺利实施,同时运维流程、运维管理、运维技术、运维制度得到有力提升。

1.2 工作目标

通过网络设备切换演练工作检验信息系统的软硬件的稳定性、高可靠性、业务不中断性、健壮性以及冗余模式下系统有效性,运行环境潜在隐患无法藏匿,并对切换演练过程中出现的各类异常进行制定相应措施,对发现的问题及时整改,确保设备发生故障时双机冗余切实有效,达到主动演练、主动发现隐患、主动排查问题,为主动运维提升服务能力添砖加瓦。具体内容如下:

(1)确保实时业务访问连续性。切换演练时,达到业务透明无感知,使得业务连续性得到保证。

(2)确保服务器集群正常使用。服务器集群中不管是HA还是RAC,切换演练工作可使得各种切换机制正常工作,确保应用数据、后台数据正常传输,生产业务不受影响。

(3)确保灾备数据备份不中断。数据库、存储上存储的数据能实时同步到灾备中心,保障数据传输稳定可靠。为生产主中心数据提供有力支撑和保障。

2 网络设备切换演练工作内容

2.1 相关组织机构

数据中心阶段性的切换演练,不论是应用软件、主机存储、数据库集群,还是网络设备、电力基础设施相关切换演练,都具有严格的组织体系,任何一个层面切换演练,都需要其他相关专业组织进行配合支持,因此演练工作需要缜密的组织体系结构、完整的运维管理制度、详尽的实施方案以及强大的运维支持服务团队,以保证网络设备切换演练工作顺利进行。

2.2 切换演练相关流程

制定切换演练工作流程是切换演练工作开始之前的一项重要工作,不容忽视,对切换演练整个工作的开展具有总体把控指导作用。结合切换演练工作实施步骤、运维技术保障团队、业务验证以及应急措施。确保演练工作有序进行,确保演练工作结束后生产安全稳定运行。流程如图1所示。

2.3 切换演练具体内容

如前文所述,网络设备属于基础设施范畴,牵涉范围广,双机主备模式、虚拟化模式,原则上切换演练对生产不具有影响,演练的目的就是发现隐患,为了避免影响范围扩大,切换演练可以划分为多次实施,划分区域、划分设备、划分业务系统进行工作实施。网络架构可分为核心区、汇聚区、接入区、广域区,可以按照区域进行分批次进行切换演练,如按照边界路由器、局域网核心区、局域网汇聚接入区三个批次进行切换演练。网络设备种类品牌具有多种,按照网络品牌进行切换演练,有利于厂家支持协调,一些数量少的某种网络设备,可以集中进行切换演练。按照业务系统进行切换演练,有利于应用软件开发厂家运维支持协调,一些业务系统共用网络设备,可以安排在同一批次进行切换演练。上述几种切换演练策略都具有一定的合理性,前提是在可控范围内将切换演练工作有序顺利完成。

网络设备切换演练工作,网络运维管理员的角色影响至关重要,当冗余网络设备进行启停操作时,网络管理员需及时对网络状态、网络配置进行核查,如网络收敛状态、网络链路状态、网络路由状态等,还需要协调厂家支持、协调其他专业组进行配合验证业务是否正常。一旦发现切换过程发现诸如硬件损坏、网络中断、业务中断等问题,切换演练工作的首要任务是恢复生产,及时记录相关现象,便于事后进行详细分析并得出结果,进而找到问题所在以及进行问题整改工作。每一项操作均验证无误后方可进行下一步操作。

每一批次网络设备切换演练结束之后,将演练结果汇报给领导,对于发现的隐患进行整改,形成相关文档进行留存。至此,切换演练整个工作才完成。

3 网络设备切换演练的总结与改进

3.1 网络设备切换演练运维管理成效

通过网络设备切换演练工作加强巩固运维管理体制,结合实际操作演练,解决日常运维管理中存在的技术弱点和管理缺点,使得信息系统各个层面,包括应用软件层面、主机资源层面、基础设备层面、第三方技术支持层面有机统一协作,相互协调,共同提高运维保障能力以及运维技术团队的技能,确保银行信息系统平稳运行。

运维团队技术的提升。任何一个企业的运维工作只有运维制度没有运维技术支撑,犹如船无舵手。运维技术不仅体现在某种网络设备的熟悉程度,而且体现在运维态度。在整个切换演练过程中,每个环节都强调操作谨小慎微、双人复核。技术能力再过硬也抵不过一个粗心大意,对突发性问题的定位、分析以及解决,既不影响生产的稳定运行,也不影响整个切换演练的时长局限。演练过程中突发问题的发生,对运维团队技术以及抗压能力的考验极高,这也是运维团队技术的考验和提升的过程。

运维团队水平的提高。信息系统不仅仅只有软件应用的存在,从基础设施到上层软件应用,任何一个环节都不能出现问题,只有各个层面各个专业有机协调配合,才能将信息系统这个“人体”保持“精力充沛,健康成长”,特别是数据中心近年来发展迅速,成立两地三中心,一体化运维渗透到各专业之间,更是渗透到各专业内部。一旦信息系统出现故障或者问题,各中心各专业组积极配合,共同分析问题,解决问题。通过切换演练,使得各个层级的运维团队协作能力得到提高,在遇到故障后能及时解决问题。

信息系统隐患的发现。切换演练的目的即是发现信息系统的隐患,对发现的隐患制定相应措施,进行相应整改,解决安全隐患,确保双机设备在设备故障发生时,及时切换,提升信息系统运行水平。

3.2 网络设备切换演练中存在的问题及改进

演练方案需要进一步完善。在日常运维管理工作中,出现许多方案、实施步骤、应急方案,切换演练也针对性的形成演练方案、实施步骤、应急方案,如果使其更具有实用性,那么切换演练的方案结构、内容、策略以及验证方式需要进一步完善修订,使其成为切换演练工作中一个标准模板方案,亦可作为知识库,供日常运维查阅。

运维团队的技术素养需要进一步提升。阶段性的切换演练提高了运维团队的技术素养,但是处理分析问题的能力尚需要进一步提高,不仅包括团队专业知识,还包括协作能力、实战经验等。积极组织培训,培养主动运维意识和能力,面对信息系统运维工作中出现故障时,能尽快梳理故障,整理思路,发现故障点,且能在最短时间内解决问题。对发现的问题以及分析解决问题过程,进行积极的总结,得出一套经验知识库,提高主动运维服务能力。保障信息系统安全平稳运行。

作者单位

信息系统应急演练总结范文第5篇

1.1架构安全

合理的架构是图书馆业务服务网络安全的前提,网络在总体结构上要减少相互间的依赖和影响。任何一个模块出现故障后,对上/下工序流程不产生严重影响。各子系统可独立运作,各子系统单一升级而不影响到其他子系统的功能。

1.2设备安全

主干网采用光纤双路备份,采用双机冗余式主干交换机,网络核心设备(交换机、服务器等)需采用模块化、支持热插拔设计。主业务应用服务器要双机热备,并采用双网卡接入、服务器集群、RAID等措施。主存储系统需要极高的安全稳定性,具有合理的存储构架和数据重新快速分配能力。在设备的分配上,避免在同一台服务器上部署多种应用。在各楼层设立交换机柜,对重要接入层设备,应考虑必要的网络设备和接入端口的备份手段。中心机房配有24小时双路电源,并配备大功率的UPS电源。另外,为防止外部的攻击和病毒的侵袭,解决业务网与办公网的信息交互问题,要设置高安全区网段,须将业务内部网络与外网分开,在物理上隔离网络,业务终端用户计算机屏蔽USB接口,不配置光驱,并安装网络版的防病毒软件。

1.3软件安全

主要有:①操作系统安全。为确保图书馆的安全,主要服务器尽可能采用企业版Linux操作系统。②数据安全。为保障关键运行数据的存储、管理和备份,要求采用集中与分布方式相结合的数据库系统设计。③应用软件安全。应用软件应具有完善的备份措施,系统故障后,要求及时恢复,确保图书分编数据不丢失,图书借还信息不丢失。④数据库系统安全。主要应用系统中的数据库均采用双机热备共享RAID盘阵的方式,实现双主机同时对外提供服务,盘阵采用了最高等级的RAID5技术,任何一个硬盘故障也不会影响系统,对于核心数据库要求采用本地备份和远程备份相结合的方式。

1.4运维安全

在提高技术系统安全性的同时,还必须提供良好的运行维护,防范由于操作不当、网络管理漏洞、运维措施不完备所造成的网络信息系统异常。在网络信息系统运行中,应对设备、服务、业务等方面的监控和故障报警。通常情况下,设备运用指示灯变成黄色,表示出现故障,应尽快进行检查。

1.5外网文件交互安全

为隔离来自办公外网等的安全风险,图书馆自动化主业务系统专门设置高安全区网段,高安全区网段的文件拷贝通过私有协议或网闸实现,主要用于与办公网络以及其他网络的数据交互的病毒防御。

2制定出一套操作性强、目的明确的应急处理预案

为了及时应对图书馆网络信息系统突发故障和事件,在完善网络信息安全体系建立策略上,在技术上应做好各种预防措施的同时,制定出一套操作性强,在突发事件发生时,能迅速做出响应并快速处理,积极恢复图书馆网络业务系统等全方位的应急体系,即网络信息系统故障应急预案。著名的墨菲定律指出:凡事只要有可能出错,那就一定会出错。因此对图书馆主信息应用系统,对其部署的机房环境、人员、网络、数据存储、应用系统的主机及数据库情况以及所使用的中间件环境等因素进行全面分析,预测网络信息故障风险点和故障可能造成的危害,确定应急预案,选择处理故障的有效手段。

3.1预案适用情形

图书馆网络信息安全涉及管理与信息技术等方面,图书馆平时要从网络、计算机操作系统、应用业务系统等安全管理规范以及计算机使用人员安全意识等几个方面,做好以下几项工作:①制定系统规章。②制订培训计划。③加强人员管理。④成立事故应急处理小组。针对图书馆网络故障对系统的影响程度,当出现以下所列情形之一时,事故处理小组确认已达到预案应急情况,应迅速启动相应的应急处理程序:①网络遭受灾害或病毒大面积攻击而造成图书馆整个业务系统的瘫痪。②网络服务器不明原因宕机,对图书馆业务造成影响范围大,且持续时间长。③网站内容被恶意篡改。④供电系统故障。⑤机房火灾。⑥空调系统及供水系统故障。

2.2预案制定及启动

预案是由图书馆信息安全管理应急处理小组负责制定及审核。小组职责是对图书馆信息网络安全的整体规划、安全应急预案演练及网络与信息系统突发事件的处理,小组组长负责启动应急预案。针对上述情形,在图书馆网络信息系统运行中可能存在以下问题,技术人员应立即启动以下应急预案。

2.2.1遇到网络遭受病毒大面积攻击而造成图书馆整个业务系统的瘫痪,立即启动以下应急预案。查找受病毒攻击的计算机,并及时从网络上隔离出来,判断病毒的性质,关闭相应的端口;对该机进行数据备份;启用防病毒软件对该机进行杀毒处理,同时对其他机器进行病毒检测软件扫描和清除工作;对被病毒感染的终端电脑进行全面杀毒之后再恢复使用;及时最新病毒攻击信息以及防御方法。

2.2.2遇到网络服务器不明原因宕机,对图书馆业务造成影响范围大,且持续时间长的情况,立即启动以下应急预案:①服务器宕机应急处置措施。图书馆关键应用系统所用的服务器宕机,应立即将网络线路切换到备用服务器上,并立即恢复应用系统正常使用;对宕机服务器进行全面检查,分析是硬件还是软件故障;立即与设备提供商联系,请求派维修人员前来维修;在确实解决问题之后,切换回主服务器,给主机加电;系统启动完毕,检查系统及双机状态;启动数据库;启动应用程序可以正常启动和运行。②网络不明原因中断。属局域网出故障断网后,网络维护人员应立即判断故障节点,及时向信息部负责人报告,查明故障原因,立即恢复。如遇无法恢复,立即进行备件更换或向有关厂商请求支援。属光纤主干出故障,立即向上级报告,并通知维护公司对光纤进行融接,尽快恢复网络功能;属与楼层的上联网线故障,应使用备用或更换新的双绞线连接至故障设备。属网络设备(光模块)故障如路由器、交换机等,应立即用相关备件替换,或与设备提供商联系更换设备,并调试畅通。属网络设备配置文件破坏如路由器、交换机,应迅速用备份配置文件重新复制配置,并调试畅通;如遇无法解决的技术问题,立即向有关厂商请求支援。属运营商管辖范围,立即与运营商维护部门申报故障,请求修复。

2.2.3遇到网站内容被恶意篡改,应参照以下应急预案。切断服务器的网络连接;从备份数据中恢复正确的数据;检查网站源码漏洞,安装网站源码的最新补丁;安装最新的系统补丁并重新配置防火墙,修改管理员密码;查看网络访问日志,分析事件发生原因、源IP地址和操作时间,并做好记录;重新恢复服务器网络连接;向保卫科备案,如造成重大损失或影响恶劣的,通知司法机关寻求法律途径解决。

2.2.4遇到供电系统故障,应参照以下应急预案。当供电系统出现故障,中心机房UPS在尚能维持供电一段时间时,应通知各业务相关部门,迅速将所有运行中的服务器、存储及网络设备等安全关机,防止数据损失。关闭所有服务器时,应遵循如下步骤:先关闭所有应用服务器和数据库服务器,再关闭存储设备。启动所有服务器时,应先打开存储设备,再打开数据库服务器,最后打开应用服务器;确认机房中所有设备安全关机之后,将UPS电源关闭;恢复供电后,重新启动所有设备运行,并把UPS电源打开。

3.2.5遇到机房火灾,应参照以下应急预案。确保人员安全;保护关键设备、数据安全;保护一般设备;机房工作人员立即按响火警警报,不参与灭火的人员迅速从机房离开;人员灭火时要切断所有电源,从消防工具箱中取出消防设备进行灭火。

2.2.6遇到空调系统及供水系统故障,应参照以下应急预案。空调系统及供水系统如有报警信息,应及时查找故障原因,对于不能自行排除的问题,应及时与设备提供商进行联系。如发现有漏水现象应马上关闭进水阀,并对漏水进行处理。当中心机房主空调因故障无法制冷,致使机房内环境温度超过摄氏40度时,打开机房房门,及时报告信息部相关领导请示,获得授权后应按顺序关闭所有服务器及网络设备。

2.3重大事件应急预案

针对发生重大事件导致图书馆网络瘫痪,信息系统无法正常运行,相关服务部门应立即启动以下应急预案:①各部门对读者服务窗口,立即恢复手工操作模式。②网络部门负责立即启动应急服务器系统。③应急系统使用期间,办证处不可对读者进行办理或办退读者借阅证。待系统正常恢复后才可办证或退证。④应急系统使用期间,各图书阅览室对读者只提供图书阅览、还书服务,并采用手工登记服务信息;暂停图书借书服务,待系统正常恢复后才可进行各项业务服务。⑤系统恢复后,网络部门应及时安排人员对读者还书期限信息进行延期处理。

3预案培训、演练及改进

图书馆网络信息系统应急预案确定后,应对与预案处置相关的所有人员进行培训,了解安全故障或事件风险点和危害程度,掌握预案应急处置办法,明确预案处理流程预警。图书馆每年要拟订年度应急演练计划,应定期或不定期开展网络信息安全预案演练,明确应急响应相关责任部门和人员的责任,模拟完成安全故障发现、判断、通报、处置、解除等各重要环节应急措施的演练,总结演练情况书面报告。图书馆网络信息系统每年至少应进行1次应急预案文档的分析、评审,根据演练总结和实际情况,进一步对预案中存在的问题和不足及时补充、完善。

4结语

随着信息技术与图书馆工作结合日益紧密,图书馆业务和服务对信息网络的依赖性越来越高。制定图书馆网络信息应急预案能提高网络与信息系统突发事件的处理能力和速度,建立科学有效的应急工作机制,确保图书馆业务系统安全运行,尽可能减少各种突发事件的危害,保障图书馆网络及信息系统安全稳定地运行。

信息系统应急演练总结范文第6篇

一、基层央行应急预案管理工作取得显著成效

(一)应急预案体系基本形成

预案是应急管理体系建设的龙头,是“一案三制”建设的起点。以德宏州为例,按照应急预案体系要求,德宏中支成立了应急与维稳工作领导小组,建立了应急通讯簿、《突发事件定期报告制度》、《应急值班管理办法》、《中国人民银行德宏州中心支行突发事件总体应急预案》、《地方银行业金融机构突发事件应急预案》和《金融消费权益保护群体性投诉事件处置应急预案》等一系列应急管理制度,为实现“统一指挥、结构合理、反应灵敏、运转高效、保障有力”的应急管理组织体系的建设目标提供了组织和制度保障。结合应急演练、应急实战和应急预案评估工作,进一步修订完善应急预案,制定应急预案的简明操作手册,将各项应急预案最核心、操作性最强的内容加以提炼,切实提升应急处置实战能力。针对德宏州地处中缅边境地区的特殊性和复杂性,以及地震、泥石流、洪涝等自然灾害频发的特点,修订完善《地震灾害应急预案》和《水灾应急预案》等预案,提升预案的预见性和前瞻性,使各类应急预案更加切合实际,更具有针对性和可操作性。在上级行的指导下,人民银行、监管部门、金融机构加强沟通,相互借鉴,不断建立和完善了各自的应急管理体系,基本形成了包括总体、部门、专项、内部和县市支行等五个层次的应急预案体系,实现了“横向到边、纵向到底”的建设目标。

(二)应急预案演练取得实际效果

演练是应急预案管理的基础,也是检验预案是否科学、合理的最有效的方法。以德宏州为例,近年来,德宏中支通过实景现场、模拟现场和视频提示相结合的形式,科学组织完成了地方法人金融机构发生流动性风险、业务系统设备切换、发行库应对突发性挤兑、汽车武装押运突发事件等多起应急演练,取得了预期的效果。如:2011年9月1日,根据昆明中支《关于在德宏州盈江县支行开展重要网络和重要应用系统切换实战应急演练的通知》要求,德宏州盈江县支行开展了重要网络和重要应用系统切换实战应急演练。此次演练,昆明中支周振海行长和王建东副行长亲临昆明会场指挥,德宏中支张金湛副行长和郑艳玲副行长分别在盈江支行和州中支坐阵指挥。通过模拟盈江县突发地震自然灾害,致使网络中断,导致会计ABS系统、国库TBS系统、办公自动化系统OA、货币金银管理信息系统无法正常运行,支行及时采取了各项应急措施,检验了支行的应急处置能力和协调能力,同时检验相关业务部门的紧急处置业务能力和水平。演练在各级领导的关心指导下和各方的通力合作下达到了预期效果,取得了圆满成功。德宏中支针对德宏州自然灾害频发、缅甸民地武冲突不断等情况,还开展了全员性模拟演练,进一步提高突发事件的应急处置能力和水平。

(三)应急预案评估工作有序开展

通过做好演练的总结和评估工作,有针对性地查找预案中存在的缺陷和不足,反复研究论证,恰当地进行修改,确保预案的科学性和可操作性。同时,近年来,随着人民银行有关政策不断推陈出新,新业务、新系统推广力度不断加大,所应对的突发事件呈现出许多新的特点,基层人民银行根据新形势和新情况,及时修订应急预案,使预案能够适应新形势下应对突发事件的要求。以德宏州为例,德宏中支组织全州人民银行系统完成了第二轮应急预案评估工作,对2011年至2014年全州人民银行应急预案的风险、内容、演练、突发事件处置等进行了评估。德宏中支依据“规范、全面、时效、责任分解”的原则,对各单位、各部门负责人、经办人员明确职责和业务处理权限,有效落实“定岗、定人、定责”的岗位责任制和“自控、互控、监控”的风险管理要求,实行各项工作全过程监督控制。通过对应急预案进行评估,所有预案内容完整、详细,分工较为明确,具有较强的操作性。但应急预案需要经过进一步的实践操作来不断完善内容,使其具有更强的操作性与时效性,以确保在发生突发事件时能真正发挥作用。

二、基层央行应急预案管理工作面临的新形势

基层人民银行应急预案的编制工作虽然取得了积极的成果,但由于应急管理是一个新的领域,应急预案的编制也是一个全新的工作,与高效处置突发事件的实践要求相比,一些预案还存在着不足,比如,有关人员对应急预案的制订还存在着模糊认识;有的预案没有针对本部门的实际和特点进行认真调查研究,存在照搬照抄上级行预案的倾向,没有根据各种不利情况可能导致的直接后果和次生、衍生事件制订较为详细、操作性强的应对处置办法;演练模拟环境过于简单,实战能力有待进一步提高等。同时,基层人民银行在应急预案管理工作还面临较为复杂的形势:

(一)信贷投放蕴含的风险因素增多

在稳健货币政策的背景下,商业银行信贷投放得到了有效控制,但个别金融机构由于本身资产质量并不高,信贷风险管理意识也很薄弱,贷款投放蕴含的道德风险、违约风险等可能会对金融体系的稳定性造成消极影响。

(二)机构退出、资产处置等工作面临诸多复杂因素

在清理过程中,有的遗留资产涉及因素较为复杂,相关债权人、债务人、善意第三人等利益各方的物权关系和权益纠纷错综复杂。如果处置不当,可能会引发上访或。

(三)各类业务信息系统面临攻击和破坏的风险不容忽视

人民银行负责运营的金融市场、支付清算、货币发行、国库、征信、反洗钱等业务网络和信息系统,对于经济社会运行具有决定性影响。随着金融电子化、信息化的发展,金融运行效率不断提高,面临的风险因素也不断增多。虽然我们在维护信息网络运行方面投入了大量的科技力量和资金,但也要清醒地认识到,敌对势力破坏手段也是日益多样化、信息化的,对这些系统稳定运行的威胁不容忽视。

(四)发行基金守押面对的风险

当前,暴力侵害金融犯罪的案件时有发生,且呈现出组织化、动态化、智能化的特点。上述复杂形势,使得区域性或系统性金融风险增加,金融突发事件隐患增大,对此,我们必须要有清醒的认识,认真加强应急管理,未雨绸缪,做到早预防,早处置。

三、推进应急预案管理工作的建议

(一)进一步完善应急预案体系

在应急预案制定过程中,既要注重与上级预案相衔接,又要注重结合基层行实际进行调整和细化。应重点围绕各类突发事件可能会出现什么情况、谁去处理、怎么处理这个重点,从各单位实际出发,怎么能把突发事件处置好,在预案中作出相应的规定,要结合基层行的工作实际,突出实用性,具有操作性。在制定预案过程中,还要注意总结以往的工作经验和传统做法,吸取失败的教训,编制处理突发公共事件的案例库,以丰富完善这方面的知识。通过广泛听取各方面意见,专家咨询、会议讨论等方式,广泛组织参与处置突发事件工作的有关领导同志、部门和人员参与、介入,为制定完善预案出谋划策,提高预案质量。

(二)加强应急演练,提高重大事件的应急处理能力

积极创造条件,组织开展应急演练活动,按照预案全过程进行,指挥机构、救援队伍、社会公众要全方位参与,协同进行,检验并完善联动机制,及时发现存在的问题,确保一旦发生突发事件,能够做到临危不乱、有效组织、快速反应、高效运转。注意抓好重点业务、重要系统的应急演练,特别是增加突发性应急演练的比例,结合具体风险点设定突发事件场景,不预先设定具体处置或操作步骤,临时召集可能涉及的部门人员,协调相关联络单位,通过模拟实战检验大家在突如其来情况下的应急能力。同时,进一步加强支付清算、货币发行、国库、征信、反洗钱等业务网络和信息系统的日常运行监测、维护,保证系统运行的平稳正常,积极推进灾备和灾难恢复能力建设,加快软硬件系统的升级换代步伐,建立防灾减灾的长效机制。

(三)做好应急预案评估和完善工作,提高预案的针对性、可操作性

结合应急预案评估暴露出来的问题,根据评估结果,遵从符合实际、易于识记、便于操作的原则,对现有应急预案进行清理,该修订的预案要尽快修订完善,需要新增的预案要尽快完成,增强预案的针对性、实用性和可操作性。对于各项应急预案的核心内容,例如应急预案启动程序、突发事件分级响应的要求、应对处置操作流程等结合实际进一步简化和规范化,便于大家了解、熟知和掌握,做到职责任务明确,应对措施具体可行,分类分级标准,明白简洁,便于操作。

(四)加强教育培训,营造全员参与应急预案管理的良好氛围

信息系统应急演练总结范文第7篇

【关键词】信息系统 外包安全 外包安全管理模式外

随着信息化技术在日常工作中的不断普及,信息系统运维已经成为信息化工作中最重要的组成之一,信息系统运维涉及数据库、中间件、硬件、存储等多个方面的专业知识,而企业内部信息化工作人员不足,专业技术能力欠缺,为保证信息系统良好、顺畅运转,需要专业化程度较高的运维服务,即信息系统运维外包服务,聘请专业技术人员对系统数据库、中间件等各个环节进行运维,随着信息系统运维外包范围的不断扩大,信息系统运维外包造成的信息安全隐患及信息安全事件不断增加,做好信息系统运维外包安全工作便成了信息化运维工作的重中之重。

1 信息系统运维外包安全管理模式分析

我们先简单分析一下常见的运维外包安全管理的模式,随着信息系统运维外包范围的不断扩大,信息系统运维外包安全管理主要由简单管理模式、制度管理模式和混合管理模式三种。

1.1 简单管理模式

主要依靠“人盯人”和运维工程师的自律实现,即指定专门人员陪同并监督运维工程师的具体操作,要求运维工程师严格遵守职业道德,达到信息系统运维外包安全管理的要求。

简单管理模式的优点是管理成本小,管理过程简单,不需要配备专门的技术人员;存在的问题主要有可操作性不强和管理效果不佳两方面:

(1)由于陪同人员的业务素养不足、技术深度不够、运维过程监管不足等原因,使得“人盯人”方法对信息系统运维外包安全管理可操作性下降,存在造成系统运维外包安全事件的隐患。

(2)信息系统运维外包工作开展过程中,基本依靠运维工程师的自律和职业操守来实现信息系统运维安全管理,难以达到信息系统运维外包安全管理要求,影响运维安全管理效果。

1.2 制度管理模式

通过运维安全制度规范运维商和运维工程师的行为,降低运维风险,实现信息系统运维外包安全管理。在运维合同签订过程中明确运维安全管理制度,并其签订运维保密协议,共同建立违反制度的处罚机制,明确约定处罚内容,在运维工程师入场工作之前先宣布管理制度和惩罚机制,用以约束其运维操作。

制度管理模式的优点是管理成本小,管理过程较为简单,管理体系相对成熟;存在的问题主要有管理可操作性不强和属于事后管理两个方面:

(1)运维管理制度的执行情况不易监控,可能造成管理制度、保密要求和惩罚机制形同虚设,不能够有效地发挥作用,降低运维系统安全管理的可操作性。

(2)制度管理模式属于事后管理范畴,即只能在事故发生后按照管理制度、保密协议和处罚机制进行追责,且追责过程中提取相关证据较为困难,追讨损失过程较为复杂。

1.3 混合管理模式

通过制度和运维安全管理设备(如堡垒机)相结合进行信息系统运维外包安全管理,即在制度管理模式的基础上,增加运维管理设备,该设备具有操作命令记录、操作过程录屏、操作权限管理、访问范围管理和访问时效管理等几个基本的功能,实现对信息系统运维外包安全的有效管理,

混合管理模式的优点是管理的可操作性强,管理体系较为成熟,属于对信息系统运维过程既有事前、事中管理,又有事后审计管理;存在的问题主要有管理成本较大和管理过程复杂两个方面:

(1)运维安全管理设备需要单独购买且需要专人进行维护,这加大了企业信息系统运维安全管理的成本。

(2)运维安全管理设备需要依据实际运维情况进行配置变更,要求设备管理人员充分了解企业网络架构、业务系统构成等内容,结合运维人员的实际情况进行操作权限、访问范围、访问时限等内容的管理,使得信息外包安全管理过程变得较为复杂。

2 信息系统运维外包安全隐患分析

依据对信息系统运维外包安全管理模式的分析,信息系统运维外包存在以下几点隐患:

2.1 信息系统运维外包造成泄密

随着企业日常工作对信息化的依赖不断加大,企业销售、财务、人力资源等重要信息均通过信息系统进行管理,如果对信息系统运维外包过程管理不严,极有可能造成重要数据泄密,对企业的发展壮大和日常工作开展造成影响。

2.2 外包工程师操作失误造成信息系统瘫痪

运维工程师技术水平良莠不齐,如不对外包工程师的运维操作进行严格规范,有可能由于操作不谨慎或误操作造成重要信息数据丢失、损坏,导致信息系统异常,甚至造成信息系统瘫痪,影响正常业务开展。

2.3 外包工程师在信息系统中植入病毒或预留后门

部分外包工程师由于利益驱动在信息系统中植入病毒或预留后门,方便其日后获取信息系统的各类资源和数据,造成信息系统运行隐患,甚至导致企业触犯国家相关法律、法规,给企业造成名誉或经济损失。

2.4 运维外包造成过度依赖

大量信息系统运维外包,造成企业内部信息化机构学习意愿下降,专业技术素养增长缓慢,发生突发事件且运维商无法及时到场,可能造成信息系统长时间停止服务,甚至长时间瘫痪,影响企业正常业务,给企业造成经济损失。

3 信息系统运维外包安全管理方法

针对信息系统运维安全隐患分析中提到的问题,我们从强化运维过程管理、加强操作风险管理、降低系统运行隐患、增强事件处理能力等四个方面进行分析,发掘出信息系统运维外包安全管理方法,用以提高信息系统运维外包安全管理水平。

3.1 完善制度管理,增加硬件保障,强化运维过程管理

(1)系统运维管理制度是信息系统运维外包安全管理工作的基础,只有拥有科学、完整、自成体系的管理制度,才有可能真正的做好信息系统运维外包安全管理工作,而制度的建立是一个长期的动态过程,即针对新的技术和管理要求要及时修订制度,将其纳入管理范畴,确保制度能够完全覆盖信息系统运维过程,同时认真落实制度,使其充分发挥规范运维商和运维工程师的作用,否则完善的制度仅仅是“一纸空文”。

(2)建立并认真执行安全事件惩罚机制,签订信息安全保密协议,加大对运维商运维过程中发生事故的处罚力度,提高运维商在出现事故后的处理成本,能够促使运维商主动加强对其人员的管理,减少信息系统运维安全事故的发生机率。

(3)引入运维安全管理类设备(如堡垒机),加强对运维人员运维过程的管理,该类设备能够全面记录运维操作、统一分配运维权限、细化管理访问范围和精确控制运维时效等方面的功能,属于信息系统运维事中管理和事后审计设备,充分利用该类设备的各项功能,对运维工程师运维操作情况进行有效规范、记录,确保对运维工程师的操作“有迹可寻”。

3.2 规范运维操作,拟定应急措施,加强操作风险管理

(1)运维工程师在进行重要操作(如数据库参数配置等)时必须出具书面告知书,经双方签字确认后方可进行操作,告知书中至少应包括操作内容、涉及信息系统、预计完成时间、可能出现的风险及风险等级预估。

(2)针对预估等级较高的风险应充分预估发生机率、影响范围等内容,拟定应急措施,确保及时解决。

(3)制定回退方案并预留充足的回退时间,针对运维过程中发生的不可预期或难以解决的问题,确保能够及时回退,保证信息系统正常运行。

3.3 测评系统安全,定期扫描漏洞,降低系统运行隐患

(1)运维工程师对信息系统进行升级后,及时聘请拥有安全评估资质的第三方进行应用系统安全评估,评估后出具有效的评估报告,依据评估结果要求运维商进行整改,直至所有问题被解决。

(2)定期对网络设备、服务器操作系统等进行漏洞扫描,有效防止系统被植入病毒或预留后门,针对新发现的漏洞及时联系运维商进行处理,确保信息系统安全运行。

3.4 提升业务素养,组织应急演练,增强事件处理能力

(1)通过专项业务培训、自主学习等方法,不断加强信息化工作人员业务素养,学习内容不仅包括数据库、信息化设备硬件维护等专业知识,还应包括管理学、统筹学、统计学等方面的知识,才能真正做到“管的高效、管的明白、管的合理”,才能促进信息系统运维外包安全管理工作朝着正确的方向发展。

(2)强化应急预案演练工作,定期组织信息化应急预案演练。演练前认真筹备,拟写演练方案,联系运维上进行应急演练技术支持;演练过程中严格按照方案进行演练,切实提高演练效果;演练后针对演练中发现的问题及时汇总、总结,逐步提高信息化工作人员处理突发事件的能力。

4 结束语

信息系统运维安全管理工作是信息系统运维工作的重要环节,做好此项工作,即能使得信息系统得到更专业、更良好的运维服务,又能最大限度的保证企业数据安全,系统稳定运行。

作者单位

信息系统应急演练总结范文第8篇

摘要:文章结合图书馆网络信息系统安全需求,提出安全体系防范策略。为了更好地应对网络系统突发事件,图书馆须制定相关的应急预案。

中图分类号:G250文献标识码:A文章编号:1003-1588(2015)05-0129-03

1背景

随着图书馆的不断发展,信息化发展的规模也不断扩大,图书馆信息系统成为图书馆业务管理中不可缺少的部分,已逐渐成为图书馆业务稳定运行的有效保障。

图书馆是365天24小时不中断为读者提供服务,信息安全已经成为图书馆正常运行的重大隐患。图书馆网络信息系统任何一个故障的出现,都会使图书馆业务运行受到不同程序的影响,如业务终端用户计算机故障、网络链接中单点故障、楼层支路交换设备故障等;而核心交换机、服务器、数据库等故障会影响到图书馆整个业务的正常运行,严重者可导致图书馆业务整体瘫痪[1]。因此,图书馆网络信息系统应始终把安全性放在首位.建立完善的安全体系,具备周密的应急预案。

2建立完善的安全体系防范策略

2.1架构安全

合理的架构是图书馆业务服务网络安全的前提,网络在总体结构上要减少相互间的依赖和影响。任何一个模块出现故障后,对上/下工序流程不产生严重影响。各子系统可独立运作,各子系统单一升级而不影响到其他子系统的功能。

2.2设备安全

主干网采用光纤双路备份,采用双机冗余式主干交换机,网络核心设备(交换机、服务器等)需采用模块化、支持热插拔设计。主业务应用服务器要双机热备,并采用双网卡接入、服务器集群、RAID等措施。主存储系统需要极高的安全稳定性,具有合理的存储构架和数据重新快速分配能力。在设备的分配上,避免在同一台服务器上部署多种应用。在各楼层设立交换机柜, 对重要接入层设备,应考虑必要的网络设备和接入端口的备份手段。中心机房配有24小时双路电源,并配备大功率的UPS电源。另外,为防止外部的攻击和病毒的侵袭,解决业务网与办公网的信息交互问题,要设置高安全区网段,须将业务内部网络与外网分开,在物理上隔离网络,业务终端用户计算机屏蔽USB接口,不配置光驱,并安装网络版的防病毒软件。

2.3软件安全

主要有:①操作系统安全。为确保图书馆的安全,主要服务器尽可能采用企业版Linux操作系统。②数据安全。为保障关键运行数据的存储、管理和备份,要求采用集中与分布方式相结合的数据库系统设计。③应用软件安全。应用软件应具有完善的备份措施,系统故障后,要求及时恢复,确保图书分编数据不丢失,图书借还信息不丢失。④数据库系统安全。主要应用系统中的数据库均采用双机热备共享RAID盘阵的方式,实现双主机同时对外提供服务,盘阵采用了最高等级的RAID5技术,任何一个硬盘故障也不会影响系统,对于核心数据库要求采用本地备份和远程备份相结合的方式。

2.4运维安全

在提高技术系统安全性的同时,还必须提供良好的运行维护,防范由于操作不当、网络管理漏洞、运维措施不完备所造成的网络信息系统异常。在网络信息系统运行中,应对设备、服务、业务等方面的监控和故障报警。通常情况下,设备运用指示灯变成黄色,表示出现故障,应尽快进行检查。

2.5外网文件交互安全

为隔离来自办公外网等的安全风险,图书馆自动化主业务系统专门设置高安全区网段,高安全区网段的文件拷贝通过私有协议或网闸实现,主要用于与办公网络以及其他网络的数据交互的病毒防御。

3制定出一套操作性强、目的明确的应急处理预案

为了及时应对图书馆网络信息系统突发故障和事件,在完善网络信息安全体系建立策略上,在技术上应做好各种预防措施的同时,制定出一套操作性强,在突发事件发生时,能迅速做出响应并快速处理,积极恢复图书馆网络业务系统等全方位的应急体系,即网络信息系统故障应急预案。

著名的墨菲定律指出:凡事只要有可能出错,那就一定会出错[2]。因此对图书馆主信息应用系统,对其部署的机房环境、人员、网络、数据存储、应用系统的主机及数据库情况以及所使用的中间件环境等因素进行全面分析,预测网络信息故障风险点和故障可能造成的危害,确定应急预案,选择处理故障的有效手段。

3.1预案适用情形

图书馆网络信息安全涉及管理与信息技术等方面,图书馆平时要从网络、计算机操作系统、应用业务系统等安全管理规范以及计算机使用人员安全意识等几个方面,做好以下几项工作: ①制定系统规章。②制订培训计划。③加强人员管理。④成立事故应急处理小组。

针对图书馆网络故障对系统的影响程度,当出现以下所列情形之一时,事故处理小组确认已达到预案应急情况,应迅速启动相应的应急处理程序:①网络遭受灾害或病毒大面积攻击而造成图书馆整个业务系统的瘫痪。②网络服务器不明原因宕机,对图书馆业务造成影响范围大,且持续时间长。③网站内容被恶意篡改。④供电系统故障。⑤机房火灾。⑥空调系统及供水系统故障。

3.2预案制定及启动

预案是由图书馆信息安全管理应急处理小组负责制定及审核。小组职责是对图书馆信息网络安全的整体规划、安全应急预案演练及网络与信息系统突发事件的处理,小组组长负责启动应急预案 。

针对上述情形,在图书馆网络信息系统运行中可能存在以下问题,技术人员应立即启动以下应急预案。

3.2.1遇到网络遭受病毒大面积攻击而造成图书馆整个业务系统的瘫痪,立即启动以下应急预案。查找受病毒攻击的计算机,并及时从网络上隔离出来,判断病毒的性质,关闭相应的端口;对该机进行数据备份;启用防病毒软件对该机进行杀毒处理,同时对其他机器进行病毒检测软件扫描和清除工作;对被病毒感染的终端电脑进行全面杀毒之后再恢复使用;及时最新病毒攻击信息以及防御方法。

3.2.2遇到网络服务器不明原因宕机,对图书馆业务造成影响范围大,且持续时间长的情况,立即启动以下应急预案:①服务器宕机应急处置措施。图书馆关键应用系统所用的服务器宕机,应立即将网络线路切换到备用服务器上,并立即恢复应用系统正常使用;对宕机服务器进行全面检查,分析是硬件还是软件故障;立即与设备提供商联系,请求派维修人员前来维修;在确实解决问题之后,切换回主服务器,给主机加电;系统启动完毕,检查系统及双机状态;启动数据库;启动应用程序可以正常启动和运行。②网络不明原因中断。属局域网出故障断网后,网络维护人员应立即判断故障节点,及时向信息部负责人报告,查明故障原因,立即恢复。如遇无法恢复,立即进行备件更换或向有关厂商请求支援。属光纤主干出故障,立即向上级报告,并通知维护公司对光纤进行融接,尽快恢复网络功能;属与楼层的上联网线故障,应使用备用或更换新的双绞线连接至故障设备。属网络设备(光模块)故障如路由器、交换机等,应立即用相关备件替换,或与设备提供商联系更换设备,并调试畅通。属网络设备配置文件破坏如路由器、交换机,应迅速用备份配置文件重新复制配置,并调试畅通;如遇无法解决的技术问题,立即向有关厂商请求支援。属运营商管辖范围,立即与运营商维护部门申报故障,请求修复。

3.2.3遇到网站内容被恶意篡改,应参照以下应急预案。切断服务器的网络连接;从备份数据中恢复正确的数据;检查网站源码漏洞,安装网站源码的最新补丁;安装最新的系统补丁并重新配置防火墙,修改管理员密码;查看网络访问日志,分析事件发生原因、源IP地址和操作时间,并做好记录;重新恢复服务器网络连接;向保卫科备案,如造成重大损失或影响恶劣的,通知司法机关寻求法律途径解决。

3.2.4遇到供电系统故障,应参照以下应急预案。当供电系统出现故障,中心机房UPS在尚能维持供电一段时间时,应通知各业务相关部门,迅速将所有运行中的服务器、存储及网络设备等安全关机,防止数据损失。关闭所有服务器时,应遵循如下步骤:先关闭所有应用服务器和数据库服务器,再关闭存储设备。启动所有服务器时,应先打开存储设备,再打开数据库服务器,最后打开应用服务器;确认机房中所有设备安全关机之后,将UPS电源关闭;恢复供电后,重新启动所有设备运行,并把UPS电源打开。

3.2.5遇到机房火灾,应参照以下应急预案。确保人员安全;保护关键设备、数据安全;保护一般设备;机房工作人员立即按响火警警报,不参与灭火的人员迅速从机房离开;人员灭火时要切断所有电源,从消防工具箱中取出消防设备进行灭火。

3.2.6遇到空调系统及供水系统故障,应参照以下应急预案。空调系统及供水系统如有报警信息,应及时查找故障原因,对于不能自行排除的问题,应及时与设备提供商进行联系。如发现有漏水现象应马上关闭进水阀,并对漏水进行处理。当中心机房主空调因故障无法制冷,致使机房内环境温度超过摄氏40度时,打开机房房门,及时报告信息部相关领导请示,获得授权后应按顺序关闭所有服务器及网络设备。

3.3重大事件应急预案

针对发生重大事件导致图书馆网络瘫痪,信息系统无法正常运行,相关服务部门应立即启动以下应急预案:①各部门对读者服务窗口,立即恢复手工操作模式。②网络部门负责立即启动应急服务器系统。③应急系统使用期间,办证处不可对读者进行办理或办退读者借阅证。待系统正常恢复后才可办证或退证。④应急系统使用期间,各图书阅览室对读者只提供图书阅览、还书服务,并采用手工登记服务信息;暂停图书借书服务,待系统正常恢复后才可进行各项业务服务。⑤系统恢复后,网络部门应及时安排人员对读者还书期限信息进行延期处理。

3.4预案处理流程

图书馆网络信息系统预案处理流程见图1。

任何一个预案的落实首先必须得到图书馆领导的重视,各业务部门的积极配合,我们才能做到最佳的处理效果。[1]

4预案培训、演练及改进

图书馆网络信息系统应急预案确定后,应对与预案处置相关的所有人员进行培训,了解安全故障或事件风险点和危害程度,掌握预案应急处置办法,明确预案处理流程预警。图书馆每年要拟订年度应急演练计划,应定期或不定期开展网络信息安全预案演练,明确应急响应相关责任部门和人员的责任,模拟完成安全故障发现、判断、通报、处置、解除等各重要环节应急措施的演练,总结演练情况书面报告。

图书馆网络信息系统每年至少应进行1次应急预案文档的分析、评审,根据演练总结和实际情况,进一步对预案中存在的问题和不足及时补充、完善。

5结语

随着信息技术与图书馆工作结合日益紧密,图书馆业务和服务对信息网络的依赖性越来越高[3]。制定图书馆网络信息应急预案能提高网络与信息系统突发事件的处理能力和速度,建立科学有效的应急工作机制,确保图书馆业务系统安全运行,尽可能减少各种突发事件的危害,保障图书馆网络及信息系统安全稳定地运行。

参考文献:

[1][ZK(#]龚剑国,刘涛.谈医院信息网络应急预案的制定和应用[J].光盘技术,2008(8):27-28.

[2]崔全会等.简论安全管理的警示职能――墨菲定律的启示[J].中国安全科学学报,1999(4).

[3]赵梅亭.信息技术与图书馆服务创新刍议[J].内蒙古科技与经济,2011(3):66-67.

信息系统应急演练总结范文第9篇

随着银行业数据大集中,商业银行分支机构的部分风险得以集中,而通信、网络、系统因素的操作风险、机房风险等仍然存在。本文结合商业银行基层分行的信息科技风险管理实践经验,对基层分行存在的问题进行了归纳,并从组织架构、机房管理、网络通信、应急演练等方面提出可行性建议。

关键词:

金融科技;信息风险;商业银行;维护管理;通信线路

随着金融业信息化的快速发展,银行业陆续实现了数据大集中至一级总行,以提高核心竞争力应对越来越激烈的市场竞争。数据大集中能够为银行业提供充分的信息支持,直接促进了金融产品的升级,提高服务和管理手段,使原本分散的风险随之集中。同时,数据集中处理对通信、网络、系统的依赖性更高,对系统开发、网络管理、运行维护等人才的要求也更加专业。对基层分行来说,认识到当前形势下所面临的信息安全风险,并且通过有效的监督管理手段,保证信息系统健康、稳定发展,防范风险,杜绝安全隐患,是一个重要课题。本文结合信息安全日常管理经验,对基层分行存在的问题及应对措施进行了归纳分析。

一、基层分支机构信息安全风险分析

(一)业务中断风险

根据《中国银监会关于印发商业银行业务连续性监管指引的通知》,原则上,重要业务恢复时间目标不得大于4小时,重要业务恢复点目标不得大于半小时。保障业务连续性运行是所有银行信息科技工作最重要的内容。因设备软硬件故障、病毒传播、网络、电力故障及人为非法操作造成系统不稳定等因素,极易造成银行业务中断或某个交易失败。业务中断不仅阻碍了银行业务的顺利开展,还将导致银行声誉受损、客户满意度下降。对于分支机构来说,业务中断风险主要来源于以下几个方面。

1.机房风险

银行的机房作为信息化基础设施的核心,好比人体的心脏,承载着业务运营的重要动力。机房是信息系统和网络信息设备的汇聚地,一旦机房发生火灾、水灾等意外,将严重影响业务的运行,同时给故障恢复带来巨大的工作量。

2.网络中断风险

分支机构的网络建立承载着上联总行、下联支行的重要作用,每一条数据链路、每一台设备都举足轻重,网络的“健壮性”是业务连续性的重要基础。数据链路的作用相当于人体的血管,网络性能应始终处于健康、无阻塞、安全的运行环境中。网络中断风险会直接导致机构无法办理与核心系统有关的任何业务,银行数据大集中也就失去了意义。

3.人员操作风险

人员操作风险是指由于内部人员错误操作或工作失误造成的信息系统风险事件。因工作人员能力欠缺、有意不遵守制度或恶意破坏,导致终端、设备、局域网内设备软硬件故障,将影响部分机构甚至是全部业务无法正常运营。

(二)数据安全风险

1.数据被窃取

数据在转存或传输过程中遭到窃取甚至恶意篡改,或由于权限控制不严导致无关人员接触到核心数据,并导致机密数据外泄等风险。一旦发生数据被不法分子窃取的情况,不仅会泄露客户信息资料,更严重的会引发客户不满,影响银行的整体声誉。

2.数据缺失

由于自然灾害、设备故障、人为因素等突发事件造成存储介质的损坏,导致部分或全部数据丢失,或未按规章制度要求进行数据转存或备份,使某个系统出现异常后,不能及时恢复,影响业务的连续性。

(三)系统建设与桌面终端风险

1.系统建设风险

数据大集中后,越来越多重要的信息系统,包括重要的业务数据只部署在总行一级,不需要在下级分支机构部署。为了提升管理,有能力的分支机构会建立一些特色化的辅助系统,由于人员少、技术能力有限等因素,这类系统常常是小众人员参与,系统架构较为简单,开发、运维、测试不分家,岗位的A/B角制度难以落实,制度监督和制约措施很难完全执行到位,直接导致的风险是在技术架构的制约下,系统逐步庞大,代码臃肿,升级和更新受限。同时,因员工的转岗、离职等因素,导致后期团队接手困难。

2.桌面终端风险

桌面终端已成为员工工作的基本工具,安装了各式生产、办公系统,存储了大量敏感信息。根据木桶理论,终端极易成为最大的风险来源,是企业网络的最基础部分,也是最薄弱的环节。随着分支机构的不断扩张,员工人数的增加,运维保障工作成倍增加,科技人员不仅要维护运营,保证业务连续性,还要提升服务,快速响应故障,锤炼技术基本功。此外,要营造创新环境,从纷繁复杂的日常工作中“跳出来”,突破固有思维局限,开拓思路,探索出有新意、有亮点、有价值的科技武器,在探索和实践中积累经验,拓展发展渠道。

二、信息安全风险管理的工作思路

(一)组织架构及制度建设

信息科技风险作为操作风险中的一类,独立于任何其他风险种类,商业银行应培养全员对信息安全问题的重视意识,成立包括管理层、中层管理者、员工构成的三级信息安全管理工作小组,设立独立的信息安全管理岗位,并配置兼职信息安全员,落实具体的信息安全管理工作。制定信息安全工作目标考核体系及管理制度,落实工作职责及任务,以积极有效的应对措施保证目标、任务的完成。

(二)机房管理

机房的建设应符合《中国人民银行计算机机房规范化工作指引》,按照C级数据中心机房建设标准,各类设备和设施应摆放整齐有序,线路、机架电缆线扎及标志整齐,有编号、标志科学统一。机房应配备电力、空调、监控等设施,在停电的情况下满足机房电力需求,配套防盗窃、防雷、防火、防静电、温湿度控制、电磁保护等措施,确保机房正常运转,并尽可能建立同城灾备机房。建立机房管理制度,落实现场巡检要求,健全各类登记簿,应明示网络拓扑图、电力设备控制开关等重要信息,方便在故障处理过程中定位到具体的点位,具体要求机房巡检内容、时间、次数,对机房运营设备的各类参数进行登记,记录并总结突发故障的处理信息,以起到警戒和预防作用。

(三)有效管理

1.管控体系

在具备条件的情况下,基层分行应建立一套包含入侵检测、防病毒、补丁分发、系统防护、非法外联、移动介质管控等在内的完善的信息安全管控体系,抵御外界入侵,防范病毒传播,修复操作系统漏洞。做好数据备份、传输及加密工作,尤其是牵涉客户的敏感信息,严防由于权限控制不严导致无关人员接触到核心数据,控制数据转存或传输过程中遭到窃取甚至恶意篡改的风险。

2.完善信息技术架构管理

基层分行信息系统研发的目的是加工来自核心及非核心的基础数据。应规范信息系统建设流程,严格把控科技项目建设风险,统筹系统建设和风险防范的矛盾性。在安全的模式下创新,把控风险,将集中的大数据加工成管理层、员工最为关心的内容,及时响应管理需求,以此促进业务、保障运营、提升管理。有计划、有步骤地推进建设“分布式的”“可复制的”“可扩展的”坚若磐石的基础平台,特别注重统筹规划信息系统等保障业务运行的基础平台,提高数据存储水平,保证业务数据安全。

3.规范运维、操作流程及手册

系统的变更应具备严格的审批流程,保证双人复核。严格划分数据源及信息系统的访问权限,应依据“最小授权”原则,由专门人员掌管各系统密码,并定期更换。建立完整的信息安全操作规范、管理流程,包括介质管理、桌面安全管理、网络管理、维护及故障处理制度、软硬件变更流程、备份管理、机房管理、巡检制度等。运维团队应着力于故障异常的监控、原因的分析及操作风险的控制,总结和借鉴行业经验,并依照操作框架梳理以问题为导向的运维处理手册,对运维故障做到“有记录”“有总结”“有分析”,运维人员可通过多种形式互相交流,提升运维管理的精细化水平。

4.软硬件产品生命周期管理

基层分行应重视信息系统、服务器、路由器、交换机及计算机设备等软硬件设备的生命周期管理,做好关键设备的冗余备份,制定设备的替换方案,提前组织基础设施的更换、维保、升级服务,建立老化、淘汰设备的“退役”机制,消除因设备生命到期而可能带来的潜在运行风险。

5.监控手段与预警机制

依托数据监控、图形展示、移动网络等技术手段,建立突发事件预警体系,对设备、通信线路、机房环境等进行在线监控,通过短信、邮件等形式实时告警,为后续应急处理提供宝贵的时间,并打下良好的基础。同时,应持续优化监控策略,不断提高告警的准确率和及时性。

(四)网络通信

采用不少于两家不同运营商的通信线路,确保网络无断点,访问带宽应满足各信息系统的带宽需求,必要的情况下引入无线网络通信。配备备份的网络设备,核心生产系统设备至少应采取双机热备,网络配置应由专人负责,网络配置的更改应有备份、双人复核确认机制。定期邀请网络设备厂家、通信运营商进驻,利用其丰富的工作经验,在网络健壮性、设备生命周期等方面进行评估。重大节假日应与市电信公司、联通公司、移动公司等通信运营商取得联系,对有关网络设备、光纤线路进行检查,排除风险隐患。

(五)建立应急预案,落实应急演练

对信息科技突发事件进行梳理,制定不同场景、不同层次、不同内容的可操作的应急预案,着重组织开展影响生产业务的风险梳理和排查,明确应急工作职责,可通过外部专业机构验证应急预案的有效性和全面性。积极开展辖内应急演练工作,包括机房安全、供电系统、UPS放电、网络线路、线路切换的自我验证、人员的操作熟练性等内容,随机抽取演练场景,做到“真演练”和“真切换”,不走形式,不走过场,结合自身环境和实际情况,调整应急演练处理过程,增强员工实战能力。总结演练过程出现的问题,形成演练报告,不断修订完善应急预案,提高信息系统对突发事件的应急处理能力,保证业务连续性。

(六)信息安全检查

全面梳理分行及分支机构风险点,尤其紧盯基层分支机构风险,坚持开展多形式的信息安全检查,坚持以“分支机构定期自查、领导亲自检查、重要时期专项检查”等多层次检查方式,强化各级人员的安全意识,不断夯实安全基线。“检查不走过场、问题不留死角”,对检查出现的问题下发整改通知单,将结果纳入绩效考核,规定整改期限,责任落实到人,到期进行复查,对反复出现的问题追求当事人、负责人的责任。通过检查,营造信息安全管理高压态势。

(七)业务培训及人员管理

一是通过面授、远程培训、送教上门等方式,每年组织科技人员、兼职信息人员进行集中培训,邀请业内专家专题授课。科技人员根据专业特长,总结日常运维经验,注重可操作性编写运维操作手册,将信息安全培训加入到新员工培训手册中,树立全员信息安全意识,降低信息安全风险。

二是建立信息安全有效交流平台,采取邮件、电话、网站等方式进行技术支持,在有条件的情况下创新技术支持手段,不但提供快捷高效的技术支持,还能够供科技人员交流日常维护经验,实时了解、准确把握、讨论常见故障。

三是开展内部师徒“传帮带”作用,从企业文化、管理理念、公文写作等方面提升员工“软”素质,另一方面通过内部宣讲、聘请外部教师、参加外部培训等方式拔高员工“硬”工夫,促使员工全面提升,主动考取专业证书。提高员工基础理论水平,探索培育和建立一支集数据分析、业务、技术综合素质于一体的专业化人才队伍,与银行各传统职能部门在相互协作中碰撞出新的火花,驱动整个银行的业务和科技能力提升,培养软件开发、网络管理、系统维护等多层面的技术骨干,进一步提升服务的能力和服务的意识,打造独具特色的“学习型”“奋斗型”“吃苦型”“创新型”精品科技人才队伍。

四是梳理员工岗位职责和分工,加大内部员工的交叉培训工作力度,遵循不相容职责相分离的原则,实现合理的组织分工,避免系统开发人员同时从事该系统的运维管理工作。

作者:雷娟 李文 单位:昆仑银行西安分行

参考文献:

[1]孟俏.银行分支机构计算机信息安全问题研究[J].金融科技时代,2015(7):69-70.

信息系统应急演练总结范文第10篇

一、指导思想和工作目标

(一)指导思想。以邓小平理论和“三个代表”重要思想为指导,深入贯彻落实科学发展观,坚持“预防为主、防御与救助相结合”,以人为本,最大限度地减轻地震灾害损失为根本宗旨,以健全完善地震应急救援体系为目标,以提高预防和应对突发地震事件能力和水平为重点,切实加强地震应急预案动态管理,促进地震应急预案体系建设与队伍体系、技术体系、保障体系建设的全面、协调、可持续发展。

(二)工作目标。通过三年左右的时间,建立健全与相关法律法规相适应的地震应急动态管理体制和机制,建成覆盖我市机关企事业单位的地震应急预案体系,使我市地震应急预案编制和修订切合实际,使培训(宣传)和演练制度化、执行和评估规范化、管理措施科学化,提高地震应急管理水平、处置能力,社会应对地震灾害能力,民众防震避险意识与自救互救能力。

二、主要任务

(一)编修要求。抗震救灾指挥部成员单位、重点行业、重要企事业单位和各乡(镇、场)及开发区要认真贯彻《中华人民共和国突发事件应对法》和《中华人民共和国防震减灾法》,深刻总结汶川地震经验教训,对本部门的地震预案进行认真梳理。一是抗震救灾指挥部成员单位、重点行业、重要企事业单位、基层组织和重大活动的主办单位都要编修预案;非重点部门、行业和单位要将地震应急内容纳入到综合防灾减灾预案中进行编修;二是各重点行业、重要企事业单位的主管部门(或牵头部门)要督促其预案的修订;三是编修预案时,要了解本部门地震风险和应急能力,掌握应急资源的分布情况,借鉴应对重、特大地震灾害事件的经验和做法,明确应急启动程序、应急指挥与协调关系、职责任务与协同机制、处置程序与保障措施等,增强预案的针对性、实用性、可操作性,以及应对大震巨灾的适应性;四是地震部门要加强对地震预案编修工作的分类指导和动态跟踪,做好上位预案与下位预案的有机衔接,以及横向预案之间的有机衔接。

(二)时间要求。做好预案编修工作,确保在年6月底前完成新一轮的预案修订。还未开展预案编制的,必须在年底前要完成预案编制工作。抗震救灾指挥部成员单位、重点行业、重要企事业单位、基层组织和重大活动的主办单位要严格落实预案管理的各项制度和工作程序,根据省、市政府及上级主管部门的地震应急预案修订情况,对本部门的应急预案进行修订;交通、水利、电力、通信、自来水等基础设施和学校、医院等人员密集场所的经营管理单位,以及可能发生次生灾害的矿山、危险物品等生产经营单位也要在年6月底前完成预案编修工作,并由主管单位负责汇总报送市地震办。

(三)培训和演练要求。抗震救灾指挥部成员单位、重点行业、重要企事业单位和各乡(镇、场)及开发区要组织制定预案培训(宣传)和演练计划,促进预案培训(宣传)和演练工作的规范化、制度化,使之形成长效机制,确保通过培训(宣传)和演练,达到有效落实应急准备、检验预案、锻炼队伍、磨合机制、明确职责、熟悉程序和提高能力的目的,开展预案培训(宣传)和演练工作要突出重点。一要因地制宜举办不同形式的培训班和组织编写预案操作手册、工作细则、流程挂图和典型案例等,对应急管理人员,特别是领导干部加强培训(宣传),确保应急管理人员、预案实施人员和应急保障人员等都能掌握预案,熟悉程序,提高能力;二要编写一些通俗易懂的预案简本和解读材料等,深入社会、贴近公众,广泛宣传预案,普及应急知识;三要推动各部门、企事业单位和基层组织定期开展预案演练,开展跨区域、跨部门、军地联合演练;四要采取有效措施,建立有效机制,规范演练工作,防止演练脱离预案走形式走过场;五是要加强对演练工作的认真总结和评估,不断完善预案、改进措施。

(四)执行和评估要求。抗震救灾指挥部成员单位、重点行业、重要企事业单位和各乡(镇、场)及开发区要大力提高预案的执行力,防止地震应急处置工作脱离预案凭经验和传统方式行事。要积极开展预案评估工作,促进提高预案编修质量,规范预案演练与执行工作。一要不断强化各级应急管理人员,特别是预案实施者和领导干部的预案意识、规则意识和责任意识;二要建立完善地震应急响应制度和预案执行监督机制;三要推进建立预案评估机制,对重要、典型的预案演练和地震事件应对及时开展总结评估。

三、主要措施

(一)加强组织领导,完善管理制度。抗震救灾指挥部成员单位、重点行业、重要企事业单位和各乡(镇、场)及开发区要认真贯彻落实《中华人民共和国突发事件应对法》、《中华人民共和国防震减灾法》以及市委、市政府的总体部署,增强应对大震巨灾的危机意识和做好地震应急预案动态管理工作的责任意识,充分发挥地震部门承担本级政府抗震救灾指挥机构日常工作的职能作用,加强各部门的协调沟通与配合,创新思路,完善机制,加强地震应急预案动态管理工作的组织领导,确保新一轮预案修订工作的顺利实施。地震部门要认真贯彻应急管理法律法规和《市人民政府办公室转发市地震局关于加强地震应急预案管理工作的意见》(政办〔〕3号),建立地震应急预案管理办法并抓好落实,要积极发挥专家在地震应急预案工作中的参谋咨询作用,不断提高地震应急预案管理人员的业务素质和工作水平。

(二)建立健全评估工作机制,推进信息平台建设。要积极推进开展地震应急预案评估工作。认真评估重要和典型突发地震灾害的应急处置和预案执行情况,对年度突发地震灾害的应急处置和地震应急预案执行情况要进行全面评估。

(三)做好地震应急预案管理信息系统的运维管理。从年月日起,地震应急预案管理信息系统已正式推广使用。该系统由国家、省、市(县、区)三级地震部门分别负责运维管理。地震部门要明确专人负责该系统的使用、维护和管理,对本地区各类地震应急预案信息数据要做到及时入库和动态更新。

上一篇:安全事故应急演练总结范文 下一篇:地质灾害应急演练总结范文