机房应急演练总结范文

时间:2023-03-04 07:29:25

机房应急演练总结

机房应急演练总结范文第1篇

4月3日下午2:30,在青岛株州路上发生了一起货车同化学药品车相撞的事故,青岛市分管副市长和市公安局领导在110指挥中心,通过青岛网通的视频终端设备及时了解和处理事故,半个小时后,一场可能发生重大污染的事故被消除了。这是2008奥运应急预案演习中的真实一幕,转播结束时,市领导对青岛网通员工说:“如果给你们打分的话,我给你们100分”。

在3月28日全省通信业奥运通信演练中,网通代表队以出色的表现赢得各级领导肯定。通过演练,全面检验了青岛网通公司奥运保障指挥体系、应急响应、协调组织、团队协作等各方面的应急能力。

今年首次的奥运通信保障演练很好地体现了青岛网通的执行力。演练前,青岛网通根据集团奥运通信指挥部统一安排,结合奥运通信保障工作的实际情况制定了演练方案。演练内容既有集团下发的业务调单,也有青岛奥帆基地场馆的业务开通和故障处理。演练从3月25日9点10分开始,历时2个小时,期间开通业务7个,包括普通电话一部、ADSL一部、ISDN电话一部、虚拟网电话两部、2M电路一条;之后又根据集团公司要求,开通5位短号码电话一部,最长开通时长为100分钟;处理障碍申告11件,最长恢复时长为35分钟。业务开通和故障处理均达到了奥运保障标准要求。其中,在2M电路开通调单于9:45由网络支撑中心派发,接单后相关保障人员立即行动起来,客户网络服务中心的技术人员10:00在主机房完成设备安装、加电测试等工作,然后兵分两路,一人在主机房等待管线维护中心调通光缆并连接设备以及配合测试,另一人则迅速赶到媒体中心辅机房,10:08辅机房完成设备安装、加电测试,在得知管线维护中心将光缆调好并取得纤芯位置后,迅速将光路连接到设备上,10:12完成主、辅机房之间的电路开通测试等各项工作,并通知TCC进行回单,业务开通历时仅为27分钟。

在这次演练中,青岛网通公司在网通大厦29楼设立了总指挥部,由公司副总经理王爽、郝吉武担任总指挥。演练完成后,指挥部又召开了总结评估会议,指出在过程和细节上的不足之处,对演练暴露出来的问题进行了认真分析并逐一制定了整改措施,为下一步奥运保障工作找准了方向。(吴永辉)

机房应急演练总结范文第2篇

中国建筑技术集团有限公司、厦门科华恒盛股份有限公司、北京时代飞扬科技有限公司、北京嘉华时展有限公司,以及北京邮电大学、北京交通大学等技术和高校代表参加了此次沙龙活动。

北京交通大学信息中心主任贾卓生以《机房与数据安全应急演练》为题,展开演讲。据他介绍,北京交通大学信息化办公室于2016年期末组织了校首次信息系统及数据安全应急演练,旨在摸清学校信息系统数据日常备份情况、检验各单位信息系统数据备份的有效性。随着学校网络规模的不断扩大、网络承载信息的不断增多,信息中心组织并开展了信息系统及数据安全应急演练。通过模拟机房突发火灾,确保系统的异地备份数据可用,不断增强信息系统数据的安全意识和应急处理能力。

信息化办公室于2016年上半年向学校部处各级学院了《关于组织北京交通大学信息系统及数据安全应急演练的通知》,安排部署应急演练的相关事宜。演练假想服务器机房发生火灾,导致服务器及其上的数据无法使用。学校通过购买新设备后,需要利用原有异地备份的数据在新设备上进行系统恢复重建。

在参与演练的信息系统中,数据容量为TB数量级的系统有多个,包括信息中心的邮件系统、教务处的课程平台系统、物流VOC数据采集与监控系统、信息中心的日志系统。所有90多个系统总的数据量接近200TB。

在演练过程中,恢复系统所需时长最长的为教务处的教务系统、毕业论文系统、大创项目系统,因为操作系统出现问题,重新安装系统花费了10多个小时,系统总恢复时长约为30小时。其他系统,如计财处的各系统大约需要12小时,招生就业处的招生资讯网需要3个小时,信息中心的OA系统约需9小时,一卡通相关各系统、邮件系统、Mis系统、科研系统等均需2至3个小时。

贾卓生总结,通过此次演练,摸清了各单位的情况,暴露出一些系统的数据备份机制存在比较大的问题:有些系统没有或很少做数据备份;有些系统只有简单的本机备份,没有异地备份;有些系统有异地备份,但从未检验过备份数据的可用性等等。信息化办公室通过此次演练了解各单位的备份需求,对于今后筹建规范化备份机制打下了工作基础。

目前,北京交通大学已扩容了异地容灾备份的存储空间,同时开通NAS存储,使所有系统管理员(包括部处和学院)都能够自己备份数据到异地容灾系统中;部署数据备份软件,自动备份所有数据和系统;各类系统向云平台迁移,利用云平台本身的镜像备份功能,可快速恢复系统。同时两套云平台互为备份,避免鸡蛋放在一个篮子里的问题。

事实上,高校机房建设、规范、维护及数据安全的问题一直存在,各院校因其信息化水平和实际使用情况不同,表现出了不同的需求。

中国建筑技术集团有限公司高级售前经理赵凯介绍,数据中心基础设施的范围包括:门禁安防系统、消防灭火系统、机房环境监控系统、楼宇自控系统、装饰装修系统。而造成数据中心设施维护风险的原因包括:不当运行维护操作、设备产品自身的故障和不科学的维护管理制度。根据专业机构统计,数据中心设施运行风险中,约70%的基础设施故障是人为失误造成的;仅有30%是由于设备自身造成的。对于数据中心用户而言,通过健康评估和项目整体维保的方式,能够提前发现设施存在的风险,及时采取有针对性的措施加以预防和解决。

数据中心整体维保,是站在整体系统而非设备的层面考虑数据中心的安全运行,由优秀第三方提供7×24小时技术支持与维修,对设备和环境进行调整配合,设备定期维护保养,灾变应急处理等。在整体维保服务中通过响应及时、管理规范、运行安全、资源可用的要求,实现“事前防范,风险前移;事中控制,快速响应;事后改进,持续评估”的持续改进原则。

厦门科华恒盛股份有限公司技术总监杨平以“提升数据机房全生命周期可靠性”为题,分享了国家开放大学、北京回龙观中学、三峡大学智慧校园等案例。其中,科华恒盛微模块数据机房为三峡大学智慧校园机房建设提供了一个集成配电系统、UPS系统、精密空调系统及冷通道系统等系统的整体解决方案,打造高效节能、智能简捷和极具扩展性的绿色数据中心。

北京嘉华时展有限公司技术总监英赫表示,未来数据中心建设主要特点为节能、环保。他举例,Facebook将美国本上之外最大的数据中心建立在位于瑞典北部城镇吕勒奥(Lulea),吕勒奥位于波罗的海北岸,距离北极圈只有100公里之遥,当地的气候因素是Facebook选择在吕勒奥建立数据中心重要原因之一。自1961年以来,吕勒奥的气温高于30度的时间不超过24小时,在该地区建立数据中心将节省大笔散热开支。这里冬天平均气温差不多零下20度,外界的冷空气被泵进楼内,服务器产生的热空气和进来的冷空庋环交换,形成自然冷却的过程。这就是典型的利用地理环境节能的数据中心建设实例。

机房应急演练总结范文第3篇

随着银行业数据大集中,商业银行分支机构的部分风险得以集中,而通信、网络、系统因素的操作风险、机房风险等仍然存在。本文结合商业银行基层分行的信息科技风险管理实践经验,对基层分行存在的问题进行了归纳,并从组织架构、机房管理、网络通信、应急演练等方面提出可行性建议。

关键词:

金融科技;信息风险;商业银行;维护管理;通信线路

随着金融业信息化的快速发展,银行业陆续实现了数据大集中至一级总行,以提高核心竞争力应对越来越激烈的市场竞争。数据大集中能够为银行业提供充分的信息支持,直接促进了金融产品的升级,提高服务和管理手段,使原本分散的风险随之集中。同时,数据集中处理对通信、网络、系统的依赖性更高,对系统开发、网络管理、运行维护等人才的要求也更加专业。对基层分行来说,认识到当前形势下所面临的信息安全风险,并且通过有效的监督管理手段,保证信息系统健康、稳定发展,防范风险,杜绝安全隐患,是一个重要课题。本文结合信息安全日常管理经验,对基层分行存在的问题及应对措施进行了归纳分析。

一、基层分支机构信息安全风险分析

(一)业务中断风险

根据《中国银监会关于印发商业银行业务连续性监管指引的通知》,原则上,重要业务恢复时间目标不得大于4小时,重要业务恢复点目标不得大于半小时。保障业务连续性运行是所有银行信息科技工作最重要的内容。因设备软硬件故障、病毒传播、网络、电力故障及人为非法操作造成系统不稳定等因素,极易造成银行业务中断或某个交易失败。业务中断不仅阻碍了银行业务的顺利开展,还将导致银行声誉受损、客户满意度下降。对于分支机构来说,业务中断风险主要来源于以下几个方面。

1.机房风险

银行的机房作为信息化基础设施的核心,好比人体的心脏,承载着业务运营的重要动力。机房是信息系统和网络信息设备的汇聚地,一旦机房发生火灾、水灾等意外,将严重影响业务的运行,同时给故障恢复带来巨大的工作量。

2.网络中断风险

分支机构的网络建立承载着上联总行、下联支行的重要作用,每一条数据链路、每一台设备都举足轻重,网络的“健壮性”是业务连续性的重要基础。数据链路的作用相当于人体的血管,网络性能应始终处于健康、无阻塞、安全的运行环境中。网络中断风险会直接导致机构无法办理与核心系统有关的任何业务,银行数据大集中也就失去了意义。

3.人员操作风险

人员操作风险是指由于内部人员错误操作或工作失误造成的信息系统风险事件。因工作人员能力欠缺、有意不遵守制度或恶意破坏,导致终端、设备、局域网内设备软硬件故障,将影响部分机构甚至是全部业务无法正常运营。

(二)数据安全风险

1.数据被窃取

数据在转存或传输过程中遭到窃取甚至恶意篡改,或由于权限控制不严导致无关人员接触到核心数据,并导致机密数据外泄等风险。一旦发生数据被不法分子窃取的情况,不仅会泄露客户信息资料,更严重的会引发客户不满,影响银行的整体声誉。

2.数据缺失

由于自然灾害、设备故障、人为因素等突发事件造成存储介质的损坏,导致部分或全部数据丢失,或未按规章制度要求进行数据转存或备份,使某个系统出现异常后,不能及时恢复,影响业务的连续性。

(三)系统建设与桌面终端风险

1.系统建设风险

数据大集中后,越来越多重要的信息系统,包括重要的业务数据只部署在总行一级,不需要在下级分支机构部署。为了提升管理,有能力的分支机构会建立一些特色化的辅助系统,由于人员少、技术能力有限等因素,这类系统常常是小众人员参与,系统架构较为简单,开发、运维、测试不分家,岗位的A/B角制度难以落实,制度监督和制约措施很难完全执行到位,直接导致的风险是在技术架构的制约下,系统逐步庞大,代码臃肿,升级和更新受限。同时,因员工的转岗、离职等因素,导致后期团队接手困难。

2.桌面终端风险

桌面终端已成为员工工作的基本工具,安装了各式生产、办公系统,存储了大量敏感信息。根据木桶理论,终端极易成为最大的风险来源,是企业网络的最基础部分,也是最薄弱的环节。随着分支机构的不断扩张,员工人数的增加,运维保障工作成倍增加,科技人员不仅要维护运营,保证业务连续性,还要提升服务,快速响应故障,锤炼技术基本功。此外,要营造创新环境,从纷繁复杂的日常工作中“跳出来”,突破固有思维局限,开拓思路,探索出有新意、有亮点、有价值的科技武器,在探索和实践中积累经验,拓展发展渠道。

二、信息安全风险管理的工作思路

(一)组织架构及制度建设

信息科技风险作为操作风险中的一类,独立于任何其他风险种类,商业银行应培养全员对信息安全问题的重视意识,成立包括管理层、中层管理者、员工构成的三级信息安全管理工作小组,设立独立的信息安全管理岗位,并配置兼职信息安全员,落实具体的信息安全管理工作。制定信息安全工作目标考核体系及管理制度,落实工作职责及任务,以积极有效的应对措施保证目标、任务的完成。

(二)机房管理

机房的建设应符合《中国人民银行计算机机房规范化工作指引》,按照C级数据中心机房建设标准,各类设备和设施应摆放整齐有序,线路、机架电缆线扎及标志整齐,有编号、标志科学统一。机房应配备电力、空调、监控等设施,在停电的情况下满足机房电力需求,配套防盗窃、防雷、防火、防静电、温湿度控制、电磁保护等措施,确保机房正常运转,并尽可能建立同城灾备机房。建立机房管理制度,落实现场巡检要求,健全各类登记簿,应明示网络拓扑图、电力设备控制开关等重要信息,方便在故障处理过程中定位到具体的点位,具体要求机房巡检内容、时间、次数,对机房运营设备的各类参数进行登记,记录并总结突发故障的处理信息,以起到警戒和预防作用。

(三)有效管理

1.管控体系

在具备条件的情况下,基层分行应建立一套包含入侵检测、防病毒、补丁分发、系统防护、非法外联、移动介质管控等在内的完善的信息安全管控体系,抵御外界入侵,防范病毒传播,修复操作系统漏洞。做好数据备份、传输及加密工作,尤其是牵涉客户的敏感信息,严防由于权限控制不严导致无关人员接触到核心数据,控制数据转存或传输过程中遭到窃取甚至恶意篡改的风险。

2.完善信息技术架构管理

基层分行信息系统研发的目的是加工来自核心及非核心的基础数据。应规范信息系统建设流程,严格把控科技项目建设风险,统筹系统建设和风险防范的矛盾性。在安全的模式下创新,把控风险,将集中的大数据加工成管理层、员工最为关心的内容,及时响应管理需求,以此促进业务、保障运营、提升管理。有计划、有步骤地推进建设“分布式的”“可复制的”“可扩展的”坚若磐石的基础平台,特别注重统筹规划信息系统等保障业务运行的基础平台,提高数据存储水平,保证业务数据安全。

3.规范运维、操作流程及手册

系统的变更应具备严格的审批流程,保证双人复核。严格划分数据源及信息系统的访问权限,应依据“最小授权”原则,由专门人员掌管各系统密码,并定期更换。建立完整的信息安全操作规范、管理流程,包括介质管理、桌面安全管理、网络管理、维护及故障处理制度、软硬件变更流程、备份管理、机房管理、巡检制度等。运维团队应着力于故障异常的监控、原因的分析及操作风险的控制,总结和借鉴行业经验,并依照操作框架梳理以问题为导向的运维处理手册,对运维故障做到“有记录”“有总结”“有分析”,运维人员可通过多种形式互相交流,提升运维管理的精细化水平。

4.软硬件产品生命周期管理

基层分行应重视信息系统、服务器、路由器、交换机及计算机设备等软硬件设备的生命周期管理,做好关键设备的冗余备份,制定设备的替换方案,提前组织基础设施的更换、维保、升级服务,建立老化、淘汰设备的“退役”机制,消除因设备生命到期而可能带来的潜在运行风险。

5.监控手段与预警机制

依托数据监控、图形展示、移动网络等技术手段,建立突发事件预警体系,对设备、通信线路、机房环境等进行在线监控,通过短信、邮件等形式实时告警,为后续应急处理提供宝贵的时间,并打下良好的基础。同时,应持续优化监控策略,不断提高告警的准确率和及时性。

(四)网络通信

采用不少于两家不同运营商的通信线路,确保网络无断点,访问带宽应满足各信息系统的带宽需求,必要的情况下引入无线网络通信。配备备份的网络设备,核心生产系统设备至少应采取双机热备,网络配置应由专人负责,网络配置的更改应有备份、双人复核确认机制。定期邀请网络设备厂家、通信运营商进驻,利用其丰富的工作经验,在网络健壮性、设备生命周期等方面进行评估。重大节假日应与市电信公司、联通公司、移动公司等通信运营商取得联系,对有关网络设备、光纤线路进行检查,排除风险隐患。

(五)建立应急预案,落实应急演练

对信息科技突发事件进行梳理,制定不同场景、不同层次、不同内容的可操作的应急预案,着重组织开展影响生产业务的风险梳理和排查,明确应急工作职责,可通过外部专业机构验证应急预案的有效性和全面性。积极开展辖内应急演练工作,包括机房安全、供电系统、UPS放电、网络线路、线路切换的自我验证、人员的操作熟练性等内容,随机抽取演练场景,做到“真演练”和“真切换”,不走形式,不走过场,结合自身环境和实际情况,调整应急演练处理过程,增强员工实战能力。总结演练过程出现的问题,形成演练报告,不断修订完善应急预案,提高信息系统对突发事件的应急处理能力,保证业务连续性。

(六)信息安全检查

全面梳理分行及分支机构风险点,尤其紧盯基层分支机构风险,坚持开展多形式的信息安全检查,坚持以“分支机构定期自查、领导亲自检查、重要时期专项检查”等多层次检查方式,强化各级人员的安全意识,不断夯实安全基线。“检查不走过场、问题不留死角”,对检查出现的问题下发整改通知单,将结果纳入绩效考核,规定整改期限,责任落实到人,到期进行复查,对反复出现的问题追求当事人、负责人的责任。通过检查,营造信息安全管理高压态势。

(七)业务培训及人员管理

一是通过面授、远程培训、送教上门等方式,每年组织科技人员、兼职信息人员进行集中培训,邀请业内专家专题授课。科技人员根据专业特长,总结日常运维经验,注重可操作性编写运维操作手册,将信息安全培训加入到新员工培训手册中,树立全员信息安全意识,降低信息安全风险。

二是建立信息安全有效交流平台,采取邮件、电话、网站等方式进行技术支持,在有条件的情况下创新技术支持手段,不但提供快捷高效的技术支持,还能够供科技人员交流日常维护经验,实时了解、准确把握、讨论常见故障。

三是开展内部师徒“传帮带”作用,从企业文化、管理理念、公文写作等方面提升员工“软”素质,另一方面通过内部宣讲、聘请外部教师、参加外部培训等方式拔高员工“硬”工夫,促使员工全面提升,主动考取专业证书。提高员工基础理论水平,探索培育和建立一支集数据分析、业务、技术综合素质于一体的专业化人才队伍,与银行各传统职能部门在相互协作中碰撞出新的火花,驱动整个银行的业务和科技能力提升,培养软件开发、网络管理、系统维护等多层面的技术骨干,进一步提升服务的能力和服务的意识,打造独具特色的“学习型”“奋斗型”“吃苦型”“创新型”精品科技人才队伍。

四是梳理员工岗位职责和分工,加大内部员工的交叉培训工作力度,遵循不相容职责相分离的原则,实现合理的组织分工,避免系统开发人员同时从事该系统的运维管理工作。

作者:雷娟 李文 单位:昆仑银行西安分行

参考文献:

[1]孟俏.银行分支机构计算机信息安全问题研究[J].金融科技时代,2015(7):69-70.

机房应急演练总结范文第4篇

关键词:媒体融合;安全播出;安全检查;防范措施

2021年1月26日,国家广播电视总局安全播出指挥部会议暨2020年度全国广播电视安全保障工作总结电视电话会议召开,会上作出了下一阶段工作要求,要求全力做好庆祝中国共产党成立100周年安全播出工作,开展安全播出大检查,组织应急演练,实施“安全播出季”高等级保障。溧阳市融媒体中心领导接到上级文件指示,高度重视,立即指派技术部门牵头对涉及安全播出的领域做了一次全面检查,并根据检查结果,对发现的安全隐患进行分析,制定了整改措施。

1本中心广播电视安全播出现状

溧阳市融媒体中心于2019年挂牌成立,原溧阳广播电视台整体并入中心并迁至新址办公。县级融媒体中心的成立,给原来来源比较单一的广播电视节目内容带来了更多选择。基于互联网技术的省级融媒体平台、兄弟县市融媒体中心、微信、微博等资讯平台都能成为节目素材来源,同时同一条节目比如一条新闻经过相应编辑后也可以在广播、电视、手机APP等不同的传播渠道上播出。媒体的融合发展,使得节目内容更加丰富,但对内容审核也提出了更严格的要求,而且各个平台采用的信号格式可能各不相同,高清、标清、宽屏、窄屏,没有统一的标准,其中涉及的每个环节都需要进行监管和处理。县级融媒体中心往往机构设置简单、技术力量薄弱、人员配备缺乏,增加了广播电视的安全播出风险。本中心广播电视播出系统在建设之初就对系统的先进性、安全实用性、高性价比等方面提出了确切的要求。系统分设两个房间进行建设,其中一个是设备中心机房,另一个是播出监看机房。设备中心机房主要由数据库、各类服务器、切换台、总控矩阵、播控机、时钟及同步系统等设备组成。这些设备都有冗余备份,能实时热切换。播出监看机房主要由电视墙和播控切换操作面板组成。电视墙根据频道信号流程实现分级预监,通过电视墙预监信号,能实时了解信号流程各节点实时播出情况。此外,总控矩阵输出信号和外接信号源也接入电视墙监控,如中央一台的3路信号、演播室信号、应急播平台信号等。为保障播出安全,本中心播出机房建设还特别注重以下几点:一是播出系统的核心设备采用的是省级电视台广泛使用的全进口设备,如主备视频服务器采用的是美国har-monicMediaDeck7000视频服务器,主备切换台使用的是荷兰Axon高标清数字播出切换器,包括周边板卡机箱也是Axon的,视频服务器还另外增加了一台正奇公司的FMS2-SDI-04D服务器作为二备;二是信号从服务器到播出的关键节点都经过跳线排,必要时可以使用跳线跳过出问题的节点直接把正常信号送至最终播出端,保证在最短时间内恢复正常播出;三是增加了一套应急播系统,其信号通过总控矩阵送入切换台。这些硬件的采用,都极大地保障了播出系统的安全性。2020年7月,溧阳市融媒体中心顺利通过江苏省县级融媒体中心建设首批验收,验收工作组的专家对溧阳市融媒体中心建设工作给予了好评。

2广播电视播出安全检查与风险防范

要保证广播电视的安全播出,需要对影响安全播出工作的风险进行识别,再结合播出系统的现状和领导对安播工作的要求,加以分析,制定防范风险的措施。以下为我中心为保障安全播出所做的安全检查与风险防范措施。2.1完善安全播出管理制度,提升人员技术水平。首先,实现制播一体化。一档节目从制作到播出,需要各部门协同工作,其中任何一个环节出现问题都影响到安全播出。制定完善的管理制度、符合实际的操作流程,加强对流程关键节点的监控,将极大提升广播电视的播出安全性。我中心利用江苏省广播电视总台“荔枝云”平台文稿系统对节目生产制作流程进行了严格规范,关键流程都需要进行审核才能进行下一流程操作。每天的节目播出单也有相应的审核机制,播出机房工作人员需严格照单播出,涉及节目内容的修改和播出条目的增减都明确了具体的时效性限制。中心领导带队对管理制度执行情况进行定期检查和随机抽查。其次,重视人员技能培训。对参与安全播出的工作人员加强思想政治教育,提高其责任意识,使其牢固树立“安全播出无小事”的思想意识。同时,定期开展技术交流与培训活动,在部门内部让业务知识全面、技术水平高的同事分享好的工作经验,部门内部人员在工作中遇到的疑点难点问题也可以提出来,供大家交流讨论,集思广益,共同进步。除了部门内部的横向交流,还可以将不同部门组织起来一起商讨,使部门之间的工作协调配合变得更加顺畅。此外,当中心采购新设备、引进新技术后,邀请厂方专业人员进行新技术、新设备的培训,这对提升工作人员的技能水平、保障安全播出工作也大有益处。最后,应急演练工作也不容忽视。定期进行应急演练可以提高值班人员应对突况的反应能力和应对水平,防止事故扩大,取得的经验又可以改进应急预案,进一步提高值班人员应对广播电视播出异常情况的及时性和有效性。应急演练方案的制定要符合安全播出工作实际,全面考虑安全播出工作中可能会遇到的突况,演练内容要有针对性。我中心在2021年春节前夕进行了一次应急演练,通过这次演练,大家对播出系统框架、信号流程有了更多的认识,对故障的判断和处理也更加准确及时。2.2加强技术安全保障,消除安全隐患。2.2.1物理风险检查与防范。物理风险主要包括两个方面。其一在机房供电环境方面,我中心配电机房是由供电公司双路供电,双路市电实现自动导换。中心设备机房所有机架实现双路供电,一路由市电直接接入,另一路由UPS接入,两路都做过防雷处理。中心设备机房配置有5台精密空调,能够保持相对恒定的温湿度。电表与温湿度的监测接入动环监控系统,能够实时监测数值变化,超出警戒值,就会触发报警。其二,人员进出管理方面,播出监看机房、设备机房、制作机房都设有门禁装置,与播出无关的人员没有授权无法进入机房,严格控制授权,相关人员必须妥善保管好自己的门禁卡,进出机房及时关门,使不法分子无机可乘。对于外部业务单位人员来访,首先做好登录制度,记录来访人员单位、来访时间、来访事由和来访人数;其次来访人员进入机房需指定专人全程陪同。2.2.2网络安全检查与风险防范。我中心在进行系统建设时就充分考虑了网络安全问题。播出网、制作网、办公网各自独立,播出网位于最内层,播出网和制作网是内网,办公网与互联网相连。互联网与办公网之间配置了深信服公司的防火墙,办公网核心交换机开放一个端口给制作网的文稿系统。核心交换机与文稿系统之间配置了绿盟公司的防火墙,入侵防护、灾备设备和文稿系统使用Linux系统,制作网作为中间网络层按照二级等保的要求建设。网络核心设备采用冗余配置,整个网络无单一崩溃点。及时更新防火墙版本,修补漏洞。2.2.3终端设备安全检查与风险防范。我中心制作网非编工作站没有配备光驱,USB接口使用安全策略禁用。制作人员使用各自的账户、密码登录系统,严禁共用账户和使用后不退出账户。系统需要远程维护时,使用专用笔记本电脑进行操作,该笔记本电脑不做他用。2.2.4数据安全检查与风险防范。我中心办公网、制作网、播出网都有自己的RAID存储阵列,各自独立,互不干扰。办公网与制作网的数据交互、制作网与播出网的数据交互通过4台摆渡服务器进行,数据传输以文件形式进行,传输结束还需进行MD5校验,确保传输数据的一致性,不会被篡改。2.3节目内容、生产过程的安全审核与风险防范。在媒体融合的背景下,节目制作生产所需素材来源渠道众多、格式质量参差不齐,需要对其一一进行甄别,大大增加了工作人员的审核工作量。每天的本地新闻节目是地方媒体生存的立足之本,是安全播出保证的重点。县级媒体机构出于经济性因素的考虑,不能为新闻制作提供专用通道,大都和其他节目制作共享传输带宽资源。为了保障新闻制作送播所需的网络带宽,本中心规定下午4点以后不能再推送其他节目,并对每天推送的电视剧条目进行了数量限制。当地方有重大活动或重要会议时,新闻制作生产时间紧凑,有时可能不能在播出时间之前完成整档新闻的打包送播工作。为此,我中心配备了一套应急播系统,可以对制作完成的新闻条目逐条播出,而不必等整档新闻完成后再打包送播。新媒体的发展,扩大了广播电视行业的受众范围,提高了广播电视行业的活力,加强了广播电视行业与受众的互动和沟通。我中心利用荔枝云平台进行的微信直播活动一年多达几十场,在增加经济效益的同时,扩大了中心的影响力,但也带来了新的安全风险。风险主要体现在直播现场人员复杂,行为言论不可控。对此,我中心的应对策略是在直播活动中加入延时器,确保节目播出安全。对于观众通过手机发送的互动留言,也有专人进行逐条审核,不让消极、负面的言论出现。2.4重要播出安保期安全检查与风险防范春节、两会等全年重要保障期的安全播出是对安全检查与风险防范措施是否行之有效的一次考验。在春节、两会期间,中央一台的春晚、新闻成为全国人民群众关注的焦点,对这些节目的转播工作必须做到万无一失。我中心为保障中央一台信号的正常播出,接入了3路中央一台信号源,1路是卫星信号,另2路是网络公司主备DCM送来的ASI解扰信号,接入信号全部都由监控信号送入监控机房大屏。安全播出重要保障期期间,中心要求技术部主任全程参与一线值班,加强对播出工作的事前、事中、事后管理,加强对中央一台信号质量包括声音的检查频次,春晚、新闻联播等重要节目播出之前设置闹钟提醒,播出过程中要全程监看,播出结束之后实行安全播出零汇报制度。

3结语

当前在我国主流媒体中,广播电视在人民群众心目中是官方舆论平台的代表,对于准确无误地传达中央的声音发挥着举足轻重的作用。安全播出是广播电视的生命线,广播电视节目的安全播出与否,事关每一个广电人。要实现广播电视的安全播出,就应重视安全检查与风险防范工作、制度管理与技术措施的结合。广大广播电视工作人员应该站在政治的高度,始终保持强烈的责任心,努力学习专业知识,提高操作技术水平,为促进广播电视事业的健康发展作出贡献。

机房应急演练总结范文第5篇

1.1架构安全

合理的架构是图书馆业务服务网络安全的前提,网络在总体结构上要减少相互间的依赖和影响。任何一个模块出现故障后,对上/下工序流程不产生严重影响。各子系统可独立运作,各子系统单一升级而不影响到其他子系统的功能。

1.2设备安全

主干网采用光纤双路备份,采用双机冗余式主干交换机,网络核心设备(交换机、服务器等)需采用模块化、支持热插拔设计。主业务应用服务器要双机热备,并采用双网卡接入、服务器集群、RAID等措施。主存储系统需要极高的安全稳定性,具有合理的存储构架和数据重新快速分配能力。在设备的分配上,避免在同一台服务器上部署多种应用。在各楼层设立交换机柜,对重要接入层设备,应考虑必要的网络设备和接入端口的备份手段。中心机房配有24小时双路电源,并配备大功率的UPS电源。另外,为防止外部的攻击和病毒的侵袭,解决业务网与办公网的信息交互问题,要设置高安全区网段,须将业务内部网络与外网分开,在物理上隔离网络,业务终端用户计算机屏蔽USB接口,不配置光驱,并安装网络版的防病毒软件。

1.3软件安全

主要有:①操作系统安全。为确保图书馆的安全,主要服务器尽可能采用企业版Linux操作系统。②数据安全。为保障关键运行数据的存储、管理和备份,要求采用集中与分布方式相结合的数据库系统设计。③应用软件安全。应用软件应具有完善的备份措施,系统故障后,要求及时恢复,确保图书分编数据不丢失,图书借还信息不丢失。④数据库系统安全。主要应用系统中的数据库均采用双机热备共享RAID盘阵的方式,实现双主机同时对外提供服务,盘阵采用了最高等级的RAID5技术,任何一个硬盘故障也不会影响系统,对于核心数据库要求采用本地备份和远程备份相结合的方式。

1.4运维安全

在提高技术系统安全性的同时,还必须提供良好的运行维护,防范由于操作不当、网络管理漏洞、运维措施不完备所造成的网络信息系统异常。在网络信息系统运行中,应对设备、服务、业务等方面的监控和故障报警。通常情况下,设备运用指示灯变成黄色,表示出现故障,应尽快进行检查。

1.5外网文件交互安全

为隔离来自办公外网等的安全风险,图书馆自动化主业务系统专门设置高安全区网段,高安全区网段的文件拷贝通过私有协议或网闸实现,主要用于与办公网络以及其他网络的数据交互的病毒防御。

2制定出一套操作性强、目的明确的应急处理预案

为了及时应对图书馆网络信息系统突发故障和事件,在完善网络信息安全体系建立策略上,在技术上应做好各种预防措施的同时,制定出一套操作性强,在突发事件发生时,能迅速做出响应并快速处理,积极恢复图书馆网络业务系统等全方位的应急体系,即网络信息系统故障应急预案。著名的墨菲定律指出:凡事只要有可能出错,那就一定会出错。因此对图书馆主信息应用系统,对其部署的机房环境、人员、网络、数据存储、应用系统的主机及数据库情况以及所使用的中间件环境等因素进行全面分析,预测网络信息故障风险点和故障可能造成的危害,确定应急预案,选择处理故障的有效手段。

3.1预案适用情形

图书馆网络信息安全涉及管理与信息技术等方面,图书馆平时要从网络、计算机操作系统、应用业务系统等安全管理规范以及计算机使用人员安全意识等几个方面,做好以下几项工作:①制定系统规章。②制订培训计划。③加强人员管理。④成立事故应急处理小组。针对图书馆网络故障对系统的影响程度,当出现以下所列情形之一时,事故处理小组确认已达到预案应急情况,应迅速启动相应的应急处理程序:①网络遭受灾害或病毒大面积攻击而造成图书馆整个业务系统的瘫痪。②网络服务器不明原因宕机,对图书馆业务造成影响范围大,且持续时间长。③网站内容被恶意篡改。④供电系统故障。⑤机房火灾。⑥空调系统及供水系统故障。

2.2预案制定及启动

预案是由图书馆信息安全管理应急处理小组负责制定及审核。小组职责是对图书馆信息网络安全的整体规划、安全应急预案演练及网络与信息系统突发事件的处理,小组组长负责启动应急预案。针对上述情形,在图书馆网络信息系统运行中可能存在以下问题,技术人员应立即启动以下应急预案。

2.2.1遇到网络遭受病毒大面积攻击而造成图书馆整个业务系统的瘫痪,立即启动以下应急预案。查找受病毒攻击的计算机,并及时从网络上隔离出来,判断病毒的性质,关闭相应的端口;对该机进行数据备份;启用防病毒软件对该机进行杀毒处理,同时对其他机器进行病毒检测软件扫描和清除工作;对被病毒感染的终端电脑进行全面杀毒之后再恢复使用;及时最新病毒攻击信息以及防御方法。

2.2.2遇到网络服务器不明原因宕机,对图书馆业务造成影响范围大,且持续时间长的情况,立即启动以下应急预案:①服务器宕机应急处置措施。图书馆关键应用系统所用的服务器宕机,应立即将网络线路切换到备用服务器上,并立即恢复应用系统正常使用;对宕机服务器进行全面检查,分析是硬件还是软件故障;立即与设备提供商联系,请求派维修人员前来维修;在确实解决问题之后,切换回主服务器,给主机加电;系统启动完毕,检查系统及双机状态;启动数据库;启动应用程序可以正常启动和运行。②网络不明原因中断。属局域网出故障断网后,网络维护人员应立即判断故障节点,及时向信息部负责人报告,查明故障原因,立即恢复。如遇无法恢复,立即进行备件更换或向有关厂商请求支援。属光纤主干出故障,立即向上级报告,并通知维护公司对光纤进行融接,尽快恢复网络功能;属与楼层的上联网线故障,应使用备用或更换新的双绞线连接至故障设备。属网络设备(光模块)故障如路由器、交换机等,应立即用相关备件替换,或与设备提供商联系更换设备,并调试畅通。属网络设备配置文件破坏如路由器、交换机,应迅速用备份配置文件重新复制配置,并调试畅通;如遇无法解决的技术问题,立即向有关厂商请求支援。属运营商管辖范围,立即与运营商维护部门申报故障,请求修复。

2.2.3遇到网站内容被恶意篡改,应参照以下应急预案。切断服务器的网络连接;从备份数据中恢复正确的数据;检查网站源码漏洞,安装网站源码的最新补丁;安装最新的系统补丁并重新配置防火墙,修改管理员密码;查看网络访问日志,分析事件发生原因、源IP地址和操作时间,并做好记录;重新恢复服务器网络连接;向保卫科备案,如造成重大损失或影响恶劣的,通知司法机关寻求法律途径解决。

2.2.4遇到供电系统故障,应参照以下应急预案。当供电系统出现故障,中心机房UPS在尚能维持供电一段时间时,应通知各业务相关部门,迅速将所有运行中的服务器、存储及网络设备等安全关机,防止数据损失。关闭所有服务器时,应遵循如下步骤:先关闭所有应用服务器和数据库服务器,再关闭存储设备。启动所有服务器时,应先打开存储设备,再打开数据库服务器,最后打开应用服务器;确认机房中所有设备安全关机之后,将UPS电源关闭;恢复供电后,重新启动所有设备运行,并把UPS电源打开。

3.2.5遇到机房火灾,应参照以下应急预案。确保人员安全;保护关键设备、数据安全;保护一般设备;机房工作人员立即按响火警警报,不参与灭火的人员迅速从机房离开;人员灭火时要切断所有电源,从消防工具箱中取出消防设备进行灭火。

2.2.6遇到空调系统及供水系统故障,应参照以下应急预案。空调系统及供水系统如有报警信息,应及时查找故障原因,对于不能自行排除的问题,应及时与设备提供商进行联系。如发现有漏水现象应马上关闭进水阀,并对漏水进行处理。当中心机房主空调因故障无法制冷,致使机房内环境温度超过摄氏40度时,打开机房房门,及时报告信息部相关领导请示,获得授权后应按顺序关闭所有服务器及网络设备。

2.3重大事件应急预案

针对发生重大事件导致图书馆网络瘫痪,信息系统无法正常运行,相关服务部门应立即启动以下应急预案:①各部门对读者服务窗口,立即恢复手工操作模式。②网络部门负责立即启动应急服务器系统。③应急系统使用期间,办证处不可对读者进行办理或办退读者借阅证。待系统正常恢复后才可办证或退证。④应急系统使用期间,各图书阅览室对读者只提供图书阅览、还书服务,并采用手工登记服务信息;暂停图书借书服务,待系统正常恢复后才可进行各项业务服务。⑤系统恢复后,网络部门应及时安排人员对读者还书期限信息进行延期处理。

3预案培训、演练及改进

图书馆网络信息系统应急预案确定后,应对与预案处置相关的所有人员进行培训,了解安全故障或事件风险点和危害程度,掌握预案应急处置办法,明确预案处理流程预警。图书馆每年要拟订年度应急演练计划,应定期或不定期开展网络信息安全预案演练,明确应急响应相关责任部门和人员的责任,模拟完成安全故障发现、判断、通报、处置、解除等各重要环节应急措施的演练,总结演练情况书面报告。图书馆网络信息系统每年至少应进行1次应急预案文档的分析、评审,根据演练总结和实际情况,进一步对预案中存在的问题和不足及时补充、完善。

4结语

随着信息技术与图书馆工作结合日益紧密,图书馆业务和服务对信息网络的依赖性越来越高。制定图书馆网络信息应急预案能提高网络与信息系统突发事件的处理能力和速度,建立科学有效的应急工作机制,确保图书馆业务系统安全运行,尽可能减少各种突发事件的危害,保障图书馆网络及信息系统安全稳定地运行。

机房应急演练总结范文第6篇

关键词:农信社;科技风险;监管

近期,鹤岗银监分局对辖内农村信用社基层社信息科技风险管理工作进行了调研,分析了其现阶段存在的问题,并结合监督工作实际,提出了相关建议。

1 辖内农村信用社信息科技工作基本情况

截至2016年上半年,鹤岗市辖内有3家农村信用合作联社共计48个网点,其中基层社、分理处、储蓄所共45个,信息科技专职员工10人,占全辖农村信用社员工总人数的0.97%。3家农村信用合作联社外包服务由省农村信用社统一负责,未独立开展信息科技外包服务。辖内各联社均建立了信息安全责任制度和信息安全应急预案。指定了主管领导和管理机构,明确了职责分工,统一安装了计算机安全软件,未发生过因违反制度规定造成的信息安全事故。各联社均建立了严格的网络安全技术防护,所有重要信息系统均与互联网建立物理隔离,各个信息系统均建立了严格的身份认证、访问控制。由于实行数据大集中,重要信息系统服务器多集中在省联社,应急处置与容灾备份都在省联社层面进行。

2 辖内农村信用社信息科技工作存在的主要问题

2.1 治理机制不完善,科技风险管控工作建设流于表面化。辖内农信社虽然在制度上能建立相应的“三道防线”,并且建立了组织领导框架及信息科技安全管理责任制度,但科技风险管控工作建设流于表面化,在制度上尚未将信息安全纳入全面风险管理体系中,信息安全管理部门未履行好管理职责,没有部门和人员承担信息科技审计职能。各联社虽制订了详细的应急预案,但未定期开展专门的信息安全应急演练。

2.2 基础设施落后,机房建设不规范。各联社均不同程度存在机房建设不达标问题,特别是基层社由于建设时间较早,在这方面的问题反映比较突出:一是供电系统存在隐患。辖内基层社基本都是单路供电,一旦出现停电,无法及时实现电路切换,长时间停电容易造成中心机房系统服务中断。个别基层社甚至没有配备发电机,只用UPS电池做为后备电源。二是机房空调系统、防火系统和防雷系统建设检测不达标。部分基层社、分理处的机房没有安装空调,无法对其室内温度进行监控、控制。并且没有漏水报警装置,没有防鼠害的相关措施;个别机房的防火、防雷系统多年未经检测,严重威胁机房安全。三是监控录像保存时间短且存有死角。个别机构的机房监控录像保存时间仅为30天,与《商业银行数据中心监管指引》关于监测录像不低于3个月的规定差距较大。

2.3 应急管理不到位,应急预案不完善。一是开展应急演练的主动性不强。农信社各基层社均未开展全方位的应急演练,机构业务部门参与应急演练的意识不强,相关部门工作职责没有明确。二是应急预案不完善。个别信用社的应急预案虽然在形式上比较完整,各项要素较为齐全,但组织体系混乱,职责分工模糊,处置环节烦琐,突发性灾难事件难以得到高效处置。个别机构应急预案没有制定业务恢复优先级列表,与重要外部机构的联络沟通机制不畅通,应急预案更新不及时。

2.4 科技人员缺少业务基础知识。无论是业务系统研发需求,还是日常使用中对系统缺陷的发现、提出,科技和业务部门都必须密切配合。但目前农村中小金融机构科技人员受缺少银行业务知识等因素制约,只局限于硬件维护,对系统运行缺少动态跟踪检测,对业务部门反映的系统漏洞不能及时就地解决,基本就是负责上报,由此经常造成业务中断。

3 辖内农村信用社基层社现有科技风险原因分析

3.1 对信息科技风险认识不到位。长期以来,高管层更多关注的是能对效益产生直接影响的信用风险和市场风险,对信息科技风险普遍重视不够。分管科技的机构高管大多都不是科技专业出身,缺少完整、系统的信息科技风险的概念和相关专业知识。没有明确的中长期信息科技发展规划,对信息科技建设模式、标准等缺乏总体安排和长远考虑,对业务拓展、增值服务、经营决策等难以提供有效支持。

3.2 信息科技人员少,岗位设置不合理。基层社科技人员严重缺乏,基本都是综合岗兼职,无论是数量还是质量,科技人员都难以达到风险防范的需求。由于没有专业科技人员,大部分基层社都达不到不兼容岗位规定和重要信息系统“双人制”要求。此外,风控部门和审计部门也缺少信息科技领域的复合型人才,大部分机构的信息科技审计人员没有信息科技审计工作经历,也没有IT从业经验,无法确保内审部门有效开展信息科技内部审计工作。

3.3 软硬件建设资金投入不足。信息科技资金投入历年来占总投入比例较低,网点、产品、市场又在快速扩张,导致信息科技基础设施出现“小牛拉大车”的现象,固有风险不断扩大。虽然高管层从支撑业务发展的角度出发已认识到该问题,已经实施了信息科技规划,但投入资金需要经过复杂审批,进程较为缓慢。

4 推进农村信用社基层网点科技风险防范工作的建议

4.1 提高信息科技治理工作。辖内基层社领导层需要进一步提高全面风险管理意识,强化对信息科技风险工作的研究和推进,需要信息科技支撑的各项业务,要形成清晰的管理和发展战略。要强化信息科技合规建设,市级、县级联社要把信息科技合规管理纳入到合规管理框架之中,充分发挥技术部门安全检查、风险部门风险监控、审计部门适时监督的“三道防线”约束作用,形成完备的监测和纠错体系。同时,风险、内审部门要积极介入相关规划制定工作,增进对信息科技风险的了解和掌握,提高规划的完整性、操作性和有效性。

4.2 加强信息科技基础设施管理建设。基层社应切实加强机房、核心路由、交换机、服务器等重要IT基础设施的建设及管理,采取有效措施防范信息科技风险。一是加大科技资金投入。按照国家关于计算机机房管理规定,加快实现机房的物理分区和相关辅助设施的建设;加强机房电力改造进程,保证核心设备和重要信息系统为双路供电,且来自于不同组UPS设备,确保机房的正常运行。二是加大检查力度,建立有效的日常监控预警机制。应定期组织开展针对机房基础设施的安全检查,及时发现并排查风险隐患。

4.3 建立和完善业务连续性规划。信用社高管层应进一步提高对业务中断风险的管控意识,加强业务连续性工作的组织领导,健全业务连续性岗位责任制度,强化信息科技合规建设。要建立针对业务中断的应急预案,对业务连续性管理的组织机构及职责进行有效地界定,各组织机构和各职能部门要认真履行职责,充分发挥作用。要定期对应急预案进行实战演练,演练过程中,要形成规范的过程记录、结果分析和总结报告等文档资料;并且基层营业网点要配备发电设备,确保业务的连续性。同时,要加强与网络运行商沟通协调,制定切实可行的方案措施,降低网络故障的发生率。

机房应急演练总结范文第7篇

一、加强组织领导,健全安全生产工作体制

1.落实一岗双责。进一步加强对安全生产工作的领导,制订《安全生产“党政同责、一岗双责”实施意见》,把安全生产责任落实到每位班子、每个科室。台班子成员在履行分管业务职责的同时,履行安全生产工作职责,抓好分管领域的安全生产工作部署指导、综合协调、督查检查,努力构建“党政同责、一岗双责、齐抓共管”的安全生产责任体系,推动安全生产管理的网格化、全程化。

2.完善管理制度。完善平安创建、安全生产、安全播出等目标责任制,层层签订责任书,实行目标动态管理考核,层层分解落实安全工作责任,严格执行相关制度规范和技术措施,做到任务明确,措施有力,责任到人。健全安全检查与事故隐患查处制度、安全审批制度、外线施工安全管理制度等,明确各项工作管理要求、办事流程和工作标准,强化责任追究内容,使各项管理工作有规可依,促进管理规范化。

3.增进部门协作。落实政法委、综治办、维稳办、平安办等相关部门的工作部署,加强与公安、交通、工商、消防、文化等部门的沟通协调,积极做好社会联防、社区共建工作,落实管控措施,加强部门协调,做好情报信息交流与工作协作,组织开展防插播为重点的地卫设施清理整治工作。健全应急联动机制,建立有效的预警和应急处置流程,开展现场救护培训,加强应急队伍建设,及时做好因自然灾害、动物啃咬、人为损坏等造成的有线电视故障的抢修工作。

二、加强基础建设,提升安全生产保障能力

1.无线数字化覆盖工程。推进广播电视无线数字化覆盖工程向乡镇延伸,完成海螺山发射台的发射系统、信源系统、供配电系统、接地防雷系统、铁塔加固工程,实现中央电视节目和省、市县16套电视节目在县城范围的覆盖。推进无线覆盖乡镇补点工程,完成大盘山发射塔铁塔主体及发射天线、卫星接收天线安装,美女峰发射塔实施基础工程建设。

2.农村应急广播体系。制订了《应急广播使用管理安全播出制度》、《村级应急广播管理制度》,组建操作人员队伍并组织培训,做好日常检测维护、故障维修,发挥智能应急广播在日常宣传和应急处置中的积极作用。

3.推进广电数据业务服务。配合县交通干线、新农村建设,做好杆线迁移和地埋管线建设,改造村老化网络线路。抓好广电传输网络日常维护,减少网络传输故障。承接社会治安监控项目,推动智慧城市建设。抓好“江南药镇”公共WIFI规划建设,以满足政府、游客、农家乐商户等三方的需求为目的,制定了WIFI无线覆盖解决方案,公共区域采用瘦AP+AC模式进行全覆盖,商家区域采用智能型AP覆盖,目前已完成浙八味市场、车站、派出所、卫生院等公共场所15个区的无线wifi建设,共完成室外29个、室内91个AP点位。

三、强化源头治理,维护单位安全生产秩序

1.组织安全教育培训。台、公司分线组织安全知识教育和形势分析,重申安全操作要求、工作流程和技术规范,增强政治意识、防范意识和责任意识,克服麻痹侥幸思想和惯性思维,做到思想重视、责任明确、,开展数字电视技术培训、技能比武、集中服务等,提高新形势下的安全保障能力。

2.开展专项整改督查。对照安全播出实施细则,对干线网络系统和业务系统、播出技术系统等开展自查自评,对大楼治安监控、消防设施、机房设备进行检查维护。参与全县安全生产月活 动,做好数字电视安装使用知识和设施保护法律法规宣传;联合供电、电信、移动等部门,开展了“三电”设施保护宣传和网络杆线联合巡查。在“两会”、五一、国庆、“G20”峰会、世界互联网大会等重要保障期,严格落实“人防”、“物防”、“技防”,对站房库房、器材设施、在建工程、有源设备等进行安全隐患排查,有效消除安全隐患。3.举行应急处置演练。先后组织了网络物理断开演练、无信号故障演练、光缆溶解演练、110处警演练等演练,并对演习情况进行分析总结,逐一整改落实演练中存在的问题。强化服务承诺,提升全省华数统一的客服热线96371用户体验,实施业务受理、安装维护、网络检测、用户回访的一站式服务,提高技术保障和服务水平。

4.强化安全过程管理。完善网络建设、安装维护、应急抢修等现场安全监管责任制,推行重大工程外聘人员意外保险制,确保不出安全事故。认真落实安全生产工作要求,对在建工程进行安全隐患排查,落实高空和上杆作业、野外操作等安全防范措施。推进网格化管理,组建护线队伍、安全员队伍和专群结合的巡护队伍,落实门房管理、大楼巡查、网络检查、双人双岗值机和网络线路日常巡查制度,做好每周线路检测、每月线路检修,加强工程施工、网络建设、安装维护、应急抢修等现场安全监管。

5.落实技术维护保障。技术部门实行一岗双职,每周二至三次对各机房设备的检修、巡查工作,重要保障期技术人员蹲点机房待命,1~11月累计对机房设备的检修巡查81次,有效确保制、编、播及媒资设备正常运行。华数公司共组织安全生产检查7次,技术部经理每周检查一次机房,工程部经理每周检查一次干线网络。在重要和敏感播出时间,所有设备停止更新、软件停止升级,网络改造和施工建设在安全范围内进行。重要播出保障期内坚持台班子带班制度,播出、发射、传输等部位实行24小时双人双岗值机,认真核对节目播出单,密切关注广播电视信号,注意省市局的预警信息和电视信号,做好每日“零报告”。

四、注重新闻报道,做好安全生产宣传引导。

1.主题宣传营氛围。广播、电视开办“平安____”宣传专栏,重点关注全县“安全生产月”开展情况,报道安全生产的新举措、新经验、好做法、工作成效,播出相关内容等22篇。围绕“五水共治”、“三改一拆”、“新农村乡风革命”、护航G20等重点工作,进行政策解读和动态报道。紧扣安全生产咨询日、国际禁毒日,开展政策普及和法治教育,营造了浓厚的舆论氛围。

2.应急报道强服务。面对突发事件,我台迅速投入应急报道,把握“第一时间、第一现场”的要求,及时报道灾情信息、救援实况和后续工作,发扬连续作战的精神,全力做好新闻报道、舆情收集、宣传引导,回应社会关切,传达社会爱心。面对“寒潮”、“台风”等天气灾害和突发事件灾害,迅速启动应急报道机制,第一时间深入基层采访报道,做好预警信息、灾情通报和防灾抢险的新闻报道,有效引导社会舆论。

机房应急演练总结范文第8篇

摘要:文章结合图书馆网络信息系统安全需求,提出安全体系防范策略。为了更好地应对网络系统突发事件,图书馆须制定相关的应急预案。

中图分类号:G250文献标识码:A文章编号:1003-1588(2015)05-0129-03

1背景

随着图书馆的不断发展,信息化发展的规模也不断扩大,图书馆信息系统成为图书馆业务管理中不可缺少的部分,已逐渐成为图书馆业务稳定运行的有效保障。

图书馆是365天24小时不中断为读者提供服务,信息安全已经成为图书馆正常运行的重大隐患。图书馆网络信息系统任何一个故障的出现,都会使图书馆业务运行受到不同程序的影响,如业务终端用户计算机故障、网络链接中单点故障、楼层支路交换设备故障等;而核心交换机、服务器、数据库等故障会影响到图书馆整个业务的正常运行,严重者可导致图书馆业务整体瘫痪[1]。因此,图书馆网络信息系统应始终把安全性放在首位.建立完善的安全体系,具备周密的应急预案。

2建立完善的安全体系防范策略

2.1架构安全

合理的架构是图书馆业务服务网络安全的前提,网络在总体结构上要减少相互间的依赖和影响。任何一个模块出现故障后,对上/下工序流程不产生严重影响。各子系统可独立运作,各子系统单一升级而不影响到其他子系统的功能。

2.2设备安全

主干网采用光纤双路备份,采用双机冗余式主干交换机,网络核心设备(交换机、服务器等)需采用模块化、支持热插拔设计。主业务应用服务器要双机热备,并采用双网卡接入、服务器集群、RAID等措施。主存储系统需要极高的安全稳定性,具有合理的存储构架和数据重新快速分配能力。在设备的分配上,避免在同一台服务器上部署多种应用。在各楼层设立交换机柜, 对重要接入层设备,应考虑必要的网络设备和接入端口的备份手段。中心机房配有24小时双路电源,并配备大功率的UPS电源。另外,为防止外部的攻击和病毒的侵袭,解决业务网与办公网的信息交互问题,要设置高安全区网段,须将业务内部网络与外网分开,在物理上隔离网络,业务终端用户计算机屏蔽USB接口,不配置光驱,并安装网络版的防病毒软件。

2.3软件安全

主要有:①操作系统安全。为确保图书馆的安全,主要服务器尽可能采用企业版Linux操作系统。②数据安全。为保障关键运行数据的存储、管理和备份,要求采用集中与分布方式相结合的数据库系统设计。③应用软件安全。应用软件应具有完善的备份措施,系统故障后,要求及时恢复,确保图书分编数据不丢失,图书借还信息不丢失。④数据库系统安全。主要应用系统中的数据库均采用双机热备共享RAID盘阵的方式,实现双主机同时对外提供服务,盘阵采用了最高等级的RAID5技术,任何一个硬盘故障也不会影响系统,对于核心数据库要求采用本地备份和远程备份相结合的方式。

2.4运维安全

在提高技术系统安全性的同时,还必须提供良好的运行维护,防范由于操作不当、网络管理漏洞、运维措施不完备所造成的网络信息系统异常。在网络信息系统运行中,应对设备、服务、业务等方面的监控和故障报警。通常情况下,设备运用指示灯变成黄色,表示出现故障,应尽快进行检查。

2.5外网文件交互安全

为隔离来自办公外网等的安全风险,图书馆自动化主业务系统专门设置高安全区网段,高安全区网段的文件拷贝通过私有协议或网闸实现,主要用于与办公网络以及其他网络的数据交互的病毒防御。

3制定出一套操作性强、目的明确的应急处理预案

为了及时应对图书馆网络信息系统突发故障和事件,在完善网络信息安全体系建立策略上,在技术上应做好各种预防措施的同时,制定出一套操作性强,在突发事件发生时,能迅速做出响应并快速处理,积极恢复图书馆网络业务系统等全方位的应急体系,即网络信息系统故障应急预案。

著名的墨菲定律指出:凡事只要有可能出错,那就一定会出错[2]。因此对图书馆主信息应用系统,对其部署的机房环境、人员、网络、数据存储、应用系统的主机及数据库情况以及所使用的中间件环境等因素进行全面分析,预测网络信息故障风险点和故障可能造成的危害,确定应急预案,选择处理故障的有效手段。

3.1预案适用情形

图书馆网络信息安全涉及管理与信息技术等方面,图书馆平时要从网络、计算机操作系统、应用业务系统等安全管理规范以及计算机使用人员安全意识等几个方面,做好以下几项工作: ①制定系统规章。②制订培训计划。③加强人员管理。④成立事故应急处理小组。

针对图书馆网络故障对系统的影响程度,当出现以下所列情形之一时,事故处理小组确认已达到预案应急情况,应迅速启动相应的应急处理程序:①网络遭受灾害或病毒大面积攻击而造成图书馆整个业务系统的瘫痪。②网络服务器不明原因宕机,对图书馆业务造成影响范围大,且持续时间长。③网站内容被恶意篡改。④供电系统故障。⑤机房火灾。⑥空调系统及供水系统故障。

3.2预案制定及启动

预案是由图书馆信息安全管理应急处理小组负责制定及审核。小组职责是对图书馆信息网络安全的整体规划、安全应急预案演练及网络与信息系统突发事件的处理,小组组长负责启动应急预案 。

针对上述情形,在图书馆网络信息系统运行中可能存在以下问题,技术人员应立即启动以下应急预案。

3.2.1遇到网络遭受病毒大面积攻击而造成图书馆整个业务系统的瘫痪,立即启动以下应急预案。查找受病毒攻击的计算机,并及时从网络上隔离出来,判断病毒的性质,关闭相应的端口;对该机进行数据备份;启用防病毒软件对该机进行杀毒处理,同时对其他机器进行病毒检测软件扫描和清除工作;对被病毒感染的终端电脑进行全面杀毒之后再恢复使用;及时最新病毒攻击信息以及防御方法。

3.2.2遇到网络服务器不明原因宕机,对图书馆业务造成影响范围大,且持续时间长的情况,立即启动以下应急预案:①服务器宕机应急处置措施。图书馆关键应用系统所用的服务器宕机,应立即将网络线路切换到备用服务器上,并立即恢复应用系统正常使用;对宕机服务器进行全面检查,分析是硬件还是软件故障;立即与设备提供商联系,请求派维修人员前来维修;在确实解决问题之后,切换回主服务器,给主机加电;系统启动完毕,检查系统及双机状态;启动数据库;启动应用程序可以正常启动和运行。②网络不明原因中断。属局域网出故障断网后,网络维护人员应立即判断故障节点,及时向信息部负责人报告,查明故障原因,立即恢复。如遇无法恢复,立即进行备件更换或向有关厂商请求支援。属光纤主干出故障,立即向上级报告,并通知维护公司对光纤进行融接,尽快恢复网络功能;属与楼层的上联网线故障,应使用备用或更换新的双绞线连接至故障设备。属网络设备(光模块)故障如路由器、交换机等,应立即用相关备件替换,或与设备提供商联系更换设备,并调试畅通。属网络设备配置文件破坏如路由器、交换机,应迅速用备份配置文件重新复制配置,并调试畅通;如遇无法解决的技术问题,立即向有关厂商请求支援。属运营商管辖范围,立即与运营商维护部门申报故障,请求修复。

3.2.3遇到网站内容被恶意篡改,应参照以下应急预案。切断服务器的网络连接;从备份数据中恢复正确的数据;检查网站源码漏洞,安装网站源码的最新补丁;安装最新的系统补丁并重新配置防火墙,修改管理员密码;查看网络访问日志,分析事件发生原因、源IP地址和操作时间,并做好记录;重新恢复服务器网络连接;向保卫科备案,如造成重大损失或影响恶劣的,通知司法机关寻求法律途径解决。

3.2.4遇到供电系统故障,应参照以下应急预案。当供电系统出现故障,中心机房UPS在尚能维持供电一段时间时,应通知各业务相关部门,迅速将所有运行中的服务器、存储及网络设备等安全关机,防止数据损失。关闭所有服务器时,应遵循如下步骤:先关闭所有应用服务器和数据库服务器,再关闭存储设备。启动所有服务器时,应先打开存储设备,再打开数据库服务器,最后打开应用服务器;确认机房中所有设备安全关机之后,将UPS电源关闭;恢复供电后,重新启动所有设备运行,并把UPS电源打开。

3.2.5遇到机房火灾,应参照以下应急预案。确保人员安全;保护关键设备、数据安全;保护一般设备;机房工作人员立即按响火警警报,不参与灭火的人员迅速从机房离开;人员灭火时要切断所有电源,从消防工具箱中取出消防设备进行灭火。

3.2.6遇到空调系统及供水系统故障,应参照以下应急预案。空调系统及供水系统如有报警信息,应及时查找故障原因,对于不能自行排除的问题,应及时与设备提供商进行联系。如发现有漏水现象应马上关闭进水阀,并对漏水进行处理。当中心机房主空调因故障无法制冷,致使机房内环境温度超过摄氏40度时,打开机房房门,及时报告信息部相关领导请示,获得授权后应按顺序关闭所有服务器及网络设备。

3.3重大事件应急预案

针对发生重大事件导致图书馆网络瘫痪,信息系统无法正常运行,相关服务部门应立即启动以下应急预案:①各部门对读者服务窗口,立即恢复手工操作模式。②网络部门负责立即启动应急服务器系统。③应急系统使用期间,办证处不可对读者进行办理或办退读者借阅证。待系统正常恢复后才可办证或退证。④应急系统使用期间,各图书阅览室对读者只提供图书阅览、还书服务,并采用手工登记服务信息;暂停图书借书服务,待系统正常恢复后才可进行各项业务服务。⑤系统恢复后,网络部门应及时安排人员对读者还书期限信息进行延期处理。

3.4预案处理流程

图书馆网络信息系统预案处理流程见图1。

任何一个预案的落实首先必须得到图书馆领导的重视,各业务部门的积极配合,我们才能做到最佳的处理效果。[1]

4预案培训、演练及改进

图书馆网络信息系统应急预案确定后,应对与预案处置相关的所有人员进行培训,了解安全故障或事件风险点和危害程度,掌握预案应急处置办法,明确预案处理流程预警。图书馆每年要拟订年度应急演练计划,应定期或不定期开展网络信息安全预案演练,明确应急响应相关责任部门和人员的责任,模拟完成安全故障发现、判断、通报、处置、解除等各重要环节应急措施的演练,总结演练情况书面报告。

图书馆网络信息系统每年至少应进行1次应急预案文档的分析、评审,根据演练总结和实际情况,进一步对预案中存在的问题和不足及时补充、完善。

5结语

随着信息技术与图书馆工作结合日益紧密,图书馆业务和服务对信息网络的依赖性越来越高[3]。制定图书馆网络信息应急预案能提高网络与信息系统突发事件的处理能力和速度,建立科学有效的应急工作机制,确保图书馆业务系统安全运行,尽可能减少各种突发事件的危害,保障图书馆网络及信息系统安全稳定地运行。

参考文献:

[1][ZK(#]龚剑国,刘涛.谈医院信息网络应急预案的制定和应用[J].光盘技术,2008(8):27-28.

[2]崔全会等.简论安全管理的警示职能――墨菲定律的启示[J].中国安全科学学报,1999(4).

[3]赵梅亭.信息技术与图书馆服务创新刍议[J].内蒙古科技与经济,2011(3):66-67.

机房应急演练总结范文第9篇

【关键词】信息系统;灾难恢复;Goldengate软件;vranger软件

0 概述

近年来随着信息化应用水平的发展,如何确保应用系统在极端情况下持续安全运行逐渐成为我们面临的重要课题。灾备的目的是确保灾难发生后业务立即恢复,应用能够尽快投入使用,采用的各种技术不论是数据备份、数据复制还是灾备技术,无非都是围绕着业务连续来进行,这些技术是灾备的关键环节。

目前,我局CIQ2000、电子内务等核心应用的应急备份系统基本建立,其他系统也实现了数据级备份。但我局现有的备份限于以前资金、设备的限制,目前仅限于核心应用和重点应用,未能覆盖所有应用,且仅是数据库层面的备份,应用层面还没有备份;现有的备份主要定位于应急备份,备份系统处理能力小于生产环境主机,发生故障切换时只能承担部分业务,而且运行速度明显比生产系统慢。以CIQ2000综合业务为例,一次数据恢复至少需要1-2小时时间,并且会产生部分业务数据丢失,将会给检验检疫业务带来很大损失;由于业务系统不断优化升级,部分应急预案得不到及时更新,有的内容过时、甚至失效。

因此,如何确保数据安全、系统持续高效运行是信息化工作人员面临的重要问题。进一步树立风险防范意识,完善信息系统应急处置预案,建立风险防范长效机制,按国家、总局标准构建山东局高起点、高性能、全覆盖的信息系统备份及灾难恢复体系势在必行。

1 国内外对信息系统灾难恢复体系的研究现状

目前国外有一些备份及灾难恢复体系建设成熟的案例,案例成本都相当高;行业内个别兄弟局实施的备份及灾难恢复体系的建设只是局限于CIQ2000核心业务系统,且只是达到应急备份水准,对于系统数据库及OA系统仅是达到了数据级备份,对于应用服务器都没有任何的备份。经过对各兄弟局进行详细调研,总结归纳如下共性问题:

(1)备份环境与生产环境不匹配。系统内各局的备份主要定位于应急备份,备份系统处理能力小于生产环境主机,发生故障切换时只能承担部分业务,而且运行速度明显比生产系统慢。

(2)备份系统未达到全覆盖。系统内各局现有的备份都限于资金、设备的限制,目前仅限于核心应用和重点应用,未能覆盖所有应用。

(3)应急预案有待进一步完善。由于业务系统不断优化升级,部分应急预案得不到及时更新,有的内容过时、甚至失效。

因此,比较全面的解决方案未有先例。无法满足目前复杂业务信息系统的备份及灾难恢复的要求。

2 信息系统灾难恢复体系的研究与建设

结合山东检验检疫工作实际,利用业界先进的、成熟的软件产品对现有的CIQ2000等主要电子业务信息系统的应急体系进行升级改造,进一步加强信息备份、灾难恢复以及业务连续性管理,提高应对突发事件的响应能力。

按照国信办《重要信息系统灾难恢复指南》和质检总局《检验检疫重要业务系统灾难恢复指南(试行)》有关要求,灾备体系的建设要着重做好等级设置、资源要素、恢复策略及预案、应急演练和日常维护几个方面的工作。

等级设置就是我们将全面梳理现有的应用系统,根据其使用范围、频率和在业务工作中的重要性确定其合理的备份等级,总局对直属局的核心业务系统的备份等级建议设定为第5级,即:使用远程数据复制技术把生产系统的数据经通信网络实时复制到备用场所;在灾难恢复时,业务功能可在很短时间内(5-30分钟内)恢复,但数据会有少量丢失。目前我局核心应用系统主要包括:CIQ2000、电子通关、电子内务等,其他系统等级根据业务情况进行确定。

资源要素是实现备份机灾难恢复必备的条件,包括:备用基础设施(机房)、备用数据处理系统(主机、软件)、备用网络系统、数据备份系统、技术支持能力、运行维护管理能力和灾难恢复预案七个方面。

(1)备用基础设施

备用基础设施是灾难恢复所需的、支持灾难备份系统运行的建筑、设备和组织。我们已经有瞿塘峡路70号灾备机房,同时对UPS、空调等动力设备进行升级改造,为达到更高级别的备份等级提供基础保障。之前部分应急备份系统已迁移到该机房,实现同城异地备份。

(2)备用数据处理系统

备用数据处理系统一般由备用的主机、存储、软件组成。灾备机房的硬件设施(服务器、存储、光纤交换机)以及软件环境(Vmware虚拟化软件、Oracle GoldenGate软件)等已经采购,为本项目实施提供了物质保障。

(3)备用网络系统

备用网络系统包含备用网络通信设备和备用数据通信线路,此部分是建设容灾备份及恢复体系的关键技术支持点。

此次容灾备份及恢复体系建设备用网络层面主要研究工作如下:

整体架构描述:研究整网采用何种架构设计思路,使其具有数据冗余和网络冗余能力。探索双线路和主备设备的设计理念,可以保证网络的畅通运行,在出现线路或者设备故障时,整网都能实现自动切换。设备之间启用BGP和OSPF动态路由协议,将全网的路由进行有效地计算和规划,动态路由协议可以提供最优的网络路径选择,提高网络的运行速度,为网络提供了故障切换和恢复功能。

灾备中心:灾备中心的网络架构将沿用数据中心架构设计思路,具有数据冗余和网络冗余功能。双线路和主备设备的设计思路,可以保证网络的畅通运行。灾备中心与分支局之间采用双线路连接,两条线路类型都采用MSTP 10M线路连接,两条线路互为冗余备份,灾备中心与数据中心之间连接采用1000M裸光纤,保证了内部数据的同步速度。

(4)数据备份系统

数据备份系统一般由数据备份的硬件、软件和数据备份介质(以下简称“介质”)组成,此部分是建设容灾备份及恢复体系的重要环节。

此次容灾备份及恢复体系建设数据备份层面主要研究工作如下:

研究利用Oracle GoldenGate软件,将Ciq2000、电子通关、电子转单等核心业务数据库数据实时复制到备份机房中的备份数据库中,使数据延迟限制在10秒中以内。

研究利用Vmware虚拟化技术将电子监管应用服务器、统计日报送通讯机等迁移到VMware服务器虚拟化群集平台中。在灾备机房新搭建一套VMware服务器虚拟化群集平台,研究利用quest公司的vranger软件定时将中心机房的虚拟机增量复制到灾备机房。

(5)技术支持能力

对灾难恢复系统的运转提供支撑和综合保障的能力,以实现灾难恢复系统的预期目标。包括硬件、系统软件和应用软件的问题分析和处理能力、网络系统安全运行管理能力、沟通协调能力等。我局有专业的计算机人才和专业的硬件、软件以及网络运行维护公司提供技术支撑和综合保障支持。

(6)运行维护管理能力

包括运行环境管理、系统管理、安全管理和变更管理等。将制修订一系列管理制度,如备用计算机机房运行管理制度、硬件和网络运行管理制度、操作系统、数据库、应用软件等运行管理制度、电子传输数据备份系统运行管理制度等以确保灾备中心正常运行维护管理。

(7)灾难恢复预案

定义信息系统灾难恢复过程中所需的任务、行动、数据和资源的文件。将修订我局《电子业务系统应急处置工作规范》用于指导相关人员在预定的灾难恢复目标内恢复信息系统支持的关键业务功能。

恢复策略及预案下一步将根据国家、总局规范和我局相关作业指导书要求进行全面梳理,查漏补缺、优化完善、定期升级,在实用的基础上做到全覆盖。

应急演练是对备份系统及应急预案的验证,将研究建立制度化的管理模式定期进行,确保发生问题时能够在第一时间启用。

日常维护是关键,下一步将加强制度建设,利用先进的技术手段建立统一的运维监控平台,研究建立信息安全风险分析和预警机制,做到未雨绸缪、防范在前,有效应对突发事件。

3 信息系统灾难恢复体系研究技术方案方面

本方案采用Oracle公司的Goldengate软件作为数据库容灾备份软件,和针对CIQ2000系统的数据特点自主开发的管理控制软件,实现了CIQ2000、电子通关、电子内务等系统的同城异地容灾备份。

采用Vmware公司的虚拟服务器技术将电子转单通讯机、电子报检通讯机、废物原料通讯机、电子监管应用服务器、电子通关应用服务器、统计日报送等应用迁移到到服务器虚拟群集平台中运行。解决了以上这些系统的单点故障问题。

采用quest公司的vranger软件定时将中心机房的虚拟机增量复制到同城异地容灾灾备机房,实现了服务器虚拟群集平台中运行的应用异地容灾备份。

通过以上方案,中心机房一旦主系统出现重大故障或灾难,备份平台可迅速启动并接管核心业务系统,确保业务持续运行。

4 结论

通过容灾备份及恢复体系的建设,利用瞿塘峡路70号机房,购置的主机、网络、数据备份设备,利用虚拟化技术、Oracle GoldenGate和vRanger Pro技术,实现核心应用系统“数据+应用”的第5级备份,实现其他应用数据定期备份、异地存放、虚拟主机备用的第3级备份。

【参考文献】

[1]法勇.检验检疫业务系统备份与恢复方案分析[J].检验检疫科学,2004.

[2]赵祖亮.青岛检验检疫局网络安全解决方案[J].计算机应用技术,2004.

[3]L eszekA .Ma eiaszek著.金芝译需求分析与系统设计汇编[M].北京:机械工业出版社,2003:60-80.

[4]重要信息系统灾难恢复指南[Z].国务院信息办.

[5]CIQ2000综合业务系统技术手册[Z].国家质检总局信息中心.

[6]电子监管系统技术手册[Z].国家质检总局信息中心.

[7]检验检疫重要业务系统灾难恢复指南[Z].国家质检总局信息中心.

机房应急演练总结范文第10篇

【关键词】业务连续性管理体系;业务影响分析和风险评估;矩阵模型分析法

一、引言

2011年银监会向全国商业银行等金融机构下发《商业银行业务连续性监管指引》(银监发〔2011〕104号,以下简称:《指引》),从业务连续性组织架构、业务影响分析、业务连续性计划与资源建设、业务连续性演练与持续改进、运营中断事件应急处置等几个方面指导国内金融机构建设业务连续性管理体系。自发文以来,国内银行一直根据监管的要求建立符合自身发展的业务连续性管理体系,然而,业务连续性管理体系的建设涉及面广、建设周期长,从“软件”方面来看,涉及现状调研、方案及计划制定、业务影响分析和风险评估、重要业务范围界定、制度建设、总体和专项应急预案建设、演练等内容,从“硬件”方面来看,涉及数据中心及灾备中心建设,需要大量的资金及时间等资源的投入,虽然《指引》发文已5年有余,但极少数银行可以完全按照监管的要求建立全面健全的业务连续性管理体系。本文以某银行业务连续性管理体系建设为研究背景,总结业务连续管理体系建设过程中的重点及难点并提出解决思路,为国内银行同业提供参考方法。

二、业务连续性管理体系建设重、难点解决措施

在业务连续性管理体系建设实践中,组织架构、业务连续性计划、业务连续性应急预案等工作实施难度较低,难点在于业务影响分析、总分行资源建设、业务连续性演练等工作,本文着重介绍上述难点的建设过程。

(一)业务影响分析

业务影响分析的主要目标是帮助银行通过识别和评估业务运营中断造成的影响,明确业务连续性管理重点,根据业务重要程度进行差异化管理,制定不同业务的恢复目标、恢复次序、确定支持重要业务对应的信息系统的恢复目标,其主要工作包括2个方面的内容,一方面是现状调研,另一方面是业务影响分析和风险评估。在现状调研阶段,由于该项工作涉及全行所有业务以及大部份部门,可采取培训、访谈、召开研讨会、调查问卷等方式,逐步推进工作开展,初步梳理出重要业务清单。在业务影响分析和风险评估阶段,结合国内外先进实践经验,采取财务影响和非财务影响两个维度对初步梳理出来的各项业务进行风险评估。财务影响和非财务影响均采用评分制,其中,财务影响主要评估该项业务中断一个工作日给银行带来的收入损失,可根据银行自身业务收入水平设置分值,该项指标是较为客观的估值;非财务影响则综合评估该项业务中断可能给银行带来的影响,如:监管负面影响、声誉损失、客户负面情绪、投资者信心/忠诚度降低、法律/诉讼风险、国家金融秩序稳定等,该项指标具有一定的主观因素,为避免主观因素影响程度过大,可采取两种方式降低影响:一是扩大调查问卷的样本量,二是对非财务影响的各个要素设置权重值,对财务影响及非财务影响设置综合评分规则。特别地,对于后台运营类、渠道类业务(比如:自助银行业务),虽然不直接产生业务收入,但它是其他业务产生收入的必要条件之一,对于此类业务计算该渠道所承载的各业务种类收入之和作为该渠道的业务收入。在确定各项业务的财务影响和非财务影响指标基础上,采取矩阵模型分析法进一步确定业务恢复的优先顺序。在确定业务恢复的优先顺序的基础上,进一步确定该业务对应的信息系统恢复目标,以指导关键信息系统的资源建设。《指引》要求,“原则上重要业务的RTO不得大于4小时,重要业务的RPO不得大于半小时”,在信息系统资源建设中,关键信息系统的恢复能力应满足重要业务RTO、RPO的时效要求。

(二)总、分行资源建设

业务连续性资源建设属于“硬件”设施范畴,主要涉及总行同城、异地灾备中心以及分行机房设备的建设。在总行层面,同城、异地灾备中心应建立重要信息系统的备份,在日常工作中应加强对灾备中心机房的巡检,确保系统正常运行。在分行层面,应从供电、网络、系统建设等方面实现全方位的应急措施,比如在供电环节,分行除配置双线路供电外,还要配备不间断电源(UPS)和应急发电机;在网络连接环节,不仅要配置不同运营商的网络线路,还要配置无线设备,确保在极端情况下仍能保障重要业务持续运营。

(三)业务连续性演练

虽然《指引》对国内商业银行开展业务连续性演练的具体方式未作硬性要求,许多银行在演练环节采用较为简单的桌面演练以应付监管的要求,这种方式虽然成本较低,但效果不好,难于检验应急预案的可行性,在实践中,某银行根据业务重要程度有针对性地对重要信息系统开展实战演练,在业务量较小的时间段将生产系统切换至灾备中心系统上运行,平时不断总结经验,实践证明,这种方式能够较好地应对突发状况。另外,许多银行在开展应急演练时,未要求业务关联方参与,《指引》明确规定,“商业银行应当将外部供应商纳入演练范围并定期开展演练;同时,应当积极参加金融同业单位、外部金融市场、金融服务平台和公共事业部门等组织的业务连续性计划演练,确保应急和协调措施的有效性”,因此,在开展应急演练时应将关联第三方纳入演练范围,注重演练的实质而非形式。

三、结束语

本文根据实践经验,对商业银行业务连续性管理体系建设过程中的重点、难点提出建议和方法,在业务影响分析环节提出按照财务影响和非财务影响来区分重要业务的分析方法,为梳理出业务恢复优先顺序提出矩阵模型分析法,实践表明,可顺利、高效地完成业务连续性管理体系的建设,有效降低重要业务中断风险,提高业务风险应对能力,满足《指引》对商业银行建设业务连续性管理体系的要求,对国内银行建设业务连续性管理体系具有参考意义。

参考文献

[1]中国银监会.商业银行业务连续性监管指引[Z].

[2]刘杰.银行业务连续性管理体系建设方法研究[J].时代金融,2014(2).

[3]吕峻.商业银行业务连续性管理问题探析[J].时代金融,2013(11).

上一篇:应急演练方案总结范文 下一篇:燃气应急演练总结范文

友情链接