全时性信息系统应急备份中心的设计与实现

时间:2022-07-19 03:08:19

全时性信息系统应急备份中心的设计与实现

摘要:全时性信息系统要求系统信息全天候不间断的运行,一旦信息系统出现异常或故障,将对业务造成严重的影响,数据应急备份中心的建设极其重要。数据容灾备份问题是政府信息化建设过程中面临的一个具有重要理论和现实意义的研究课题。该文在分析人力资源和社会保障信息化现状的基础上,采用基于Oracle数据库的第三方同步复制软件,完成了应急备份数据中心的方案的设计及实现。

关键词:人力资源和社会保障;数据容灾;备份;数据同步

中图分类号:TP391文献标识码:A文章编号:1009-3044(2012)13-2932-03

Emergency Backup Center of Full Time Information System Design and Implementation

CHEN Zhen

(Information Center,Human Resource and Social Security Bureau, Changzhou 213000,China)

Abstract:Full time information system requirements system information round-the-clock uninterrupted operation, once the information system is abnormal or fault, will cause serious influence on business, data emergency backup center construction is very important. Data backup is the government information construction process faces an important theoretical and practical significance of the research topic. Based on the analysis of human resources and social security information on the basis of the status quo, using Oracle database based on third party synchronous replication software, completed the emergency backup data center solution design and implementation.

Key words:human resources and social security; data disaster recovery; backup; data synchronization

1概述

信息技术已经渗透到我们生活的方方面面,并改变着我们的生活方式。离开信息技术,人类生活将陷入困境,所以信息技术的安全性是人们关心的重要问题。容灾的解决方案是保证信息安全的一个重要手段。

影响信息系统崩溃的灾难形式可能很多,包括自然原因导致的灾难如地震、洪水、火灾、飓风、恐怖活动等和人为操作导致的系统崩溃或数据无法恢复。系统保护措施必须能够确保在各种自然的或人为的灾难发生造成基本处理设施毁坏的情况下能迅速恢复系统的处理功能。因此保持业务的持续性[1]已成为信息系统建设必须考虑的重要目标之一。

常州市“金保工程”已经建成了市级信息中心,人力资源和社会保障业务数据[2]全部集中到了数据中心,社会保险、劳动就业以及劳动仲裁、劳动监察、劳动关系等行政业务都已经使用市局统一开发的应用软件,所有人力资源和社会保障经办机构都已经实现了与市信息中心的联网,数据中心承担着全市人力资源和社会保障业务核心技术支持工作,对全市人力资源和社会保障工作的正常开展发挥着十分重要的作用。进而对信息中心的安全性提出了更高的要求,一旦信息中心机房出现异常故障,将不可避免地会对业务系统造成一定的影响。为了最大程度地降低业务的影响程度,应急备用中心的建设就显得迫在眉捷。

2应急备份中心的总体规划

2.1建设目标

在常州市人社局信息中心建设完成的基础上,进一步提高人力资源和社会保障信息系统对突发事件和灾难恢复能力,保障重要信息系统持续运行能力,增强业务系统的容灾抗灾能力,对业务进行负载分担。

2.2建设原则

系统的总体设计以提高性能和实用性为目标,将主要考虑系统结构、系统应用、运维管理和技术服务等方面综合设计,系统的设计和实现将遵循以下原则:

1)集成性和实用性

金保系统在本着实用性的原则下,将集成各种先进软硬件,以便系统能够高效的发挥作用并正常工作。

2)先进性和安全性

技术先进性系统结构能够满足和适应业务系统快速变化和发展的要求,同时系统的安全性也是不可忽视的一个方面,技术的先进性也是保证系统安全性的一个有效手段。

3)可靠性和成熟性

要保证系统具有良好的安全性、运行可靠性,必须提高系统技术的成熟性和可靠性。在运行可靠的前提下,保证全时性信息系统的全天候工作,必须提高系统的容错能力,保证系统出现问题和故障时能迅速地修复,技术的成熟性也是一个不容忽视的问题。

4)管理性和维护性

数据中心各部分是有机集成,集中控制。数据中心是一个复杂的系统,系统从一开始设计就要架构合理,模块清晰。在设计系统时,需要考虑对整个系统进行管理、监控和维护的功能,以保证系统发生故障时能有效及时进行恢复,尽量减少损失,同时还要考虑管理员能方便、快捷地完成日常的管理和维护工作。

5)可扩充性和兼容性

为了使系统能够适应未来发展的需要,系统设计应充分考虑可可扩充性和兼容性,系统一般采用模块化形式设计,同时考虑包括采用产品的工业标准、不同型号类型设备的兼容、接口等方面。

3应急备份中心的设计

3.1信息中心基础建设现状

目前常州市人社局采用2台IBM POWER 590小型机服务器作为核心业务的数据库服务器,承担着业务数据的存储和处理,2台小型机服务器通过HACMP集群软件组成一个高可靠性的集群系统,通过ORACLE RAC[3]进行业务并发处理,进一步提高业务处理能力,减少容错时在连接上所花费的时间,所有业务的数据全部集成存储在1台IBM DS8100高端存储阵列柜中。采用1台IBM POWER 670小型机作为测试服务器,挂载IBM FAST700存储阵列柜,用于承担业务软件后续优化、再次开发测试使用,以避免在直接在生产主机上进行开发测试,对业务系统和数据带来不可避免的损失。采用1台IBM POWER 570小型机作为本地备份恢复服务器,以进行本地磁带备份恢复验证。采用13把刀片服务器与5台PC服务器作为应用服务器,分别承担着医保、社保、就业、市民卡、档案等业务系统,通过F5负载均衡器进行业务负载分担。

3.2设计方案

在应急备份中心新增1台企业级光纤SAN存储阵列柜,采用IBM P5 570小型机作为数据库服务器,通过2块光纤HBA卡连接光纤存储阵列柜,通过2条运营商的线路与市人社局信息中心互联互通。采用DSG Realsync软件作为关键系统的数据灾备方案,两站点均为活动节点,应急备份中心的数据库也处于OPEN状态,这样在不影响生产数据库的同时为生产数据库在异地建立了一份准实时镜像,以保证在生产数据库发生灾难时可使用容灾数据库进行业务接管和数据恢复,同时也可以把对数据进行读取操作的业务(如决策、查询)切换至应急备份中心,以达到业务负载均衡的目的。

系统拓朴架构如图1所示。

图1系统架构图

3.3核心技术——Realsync工作原理

如图2所示,生产中心和应急备份中心都安装有Agent进程,生产中的Agent进程负责对ORACLE日志进行监控,一旦数据改变就更新数据库。

当生产中心向数据库进行任何操作[4]时,将会重做日志中保存,Agent进程通过实时获取的日志进行分析,获得本次操作的交易指令和交易数据,进而将本次交易指令和交易数据经过格式转化生成DXF数据格式,并实时通过网络传送到目标端的数据库。

图2 Realsync工作原理图

3.3.1日志抓取

通过安装在源端的Agent模块定时分析Oracle重做日志,来获取源端的交易类型及数据的。Agent通过定期检查Oracle控制文件中记录的当前SCN号来判断源端的Oracle系统是否有新的交易产生,避免每次检测都通过读取日志文件来判断否有新的交易产生,造成对系统运行的影响。

3.3.2日志分析

日志中记录了Oracle数据库的所有更改,数据库中的每一个变化。通过对日志的分析,可以得到数据库中的每个SQL指令,将这些SQL指令转换成DXF格式的表达方式,该表达方式可以方便转换为ORACL的内部数据表达格式,实现分析和转载的最小转化,提高分析和装载速度,减少资源的占用,也丰富了表达的数据类型。

3.3.3交易合成

通过ORACLE重做日志分析的交易指令存在如下的几个特点:

(1)这些指令是交叉出现的,属于一个交易的多条SQL指令是非连续存储的,多个交易的SQL之间是相互穿插的;

(2)重做日志中记录了所有提交的交易以及没有提交的交易;

所以,为了更加容易控制目标端的交易装载,把一个交易作为复制的最小单位,而不是单个的SQL指令。同时,在复制的时候,也只复制提交的交易。

3.3.4数据交易

为了确保证数据传输过程中的安全性和可靠性,对数据的传输作了一些特殊的处理与支持:

(1)在传输之前,首先把数据存入生产中心(源端)的缓存中,传输进程从缓存中读取交易数据,并封装为TCP/IP数据包,再传送给应急备份中心(目标端)的导入进程。

图3数据交易过程

(2)在应急备份中心即目标端的导入进程收到传输的交易数据包后,先把交易数据存入队列,接着装载进程从队列中严格按照交易的顺序装载交易信息。

如图3所示,负责传输的进程从本地队列中按照先进先出的原则抓取需要传输的交易,把然后交易数据封装成一个数据包,接着通过TCP/IP协议传递给对端系统。对端系统在接受到传来的数据包后,根据包头描述的包大小进行传输的合法性检查,并判断是否传输完整。

4结论

常州市人社局应急备份中心的建设完成后,通过建立核心业务的灾备平台,提高人力资源和社会保障信息系统应对突发事件和灾难的能力。容灾应急备份中心和生产中心只是做数据库的实时同步,5秒内就可以把生产中心数据的增量部分通过日志方式发送到容灾备份中心。可以实现对业务关键数据的容灾及保护,在不影响生产数据库性能的同时为生产数据库在异地建立一份准实时镜像,以保证在生产数据库发生灾难时可使用容灾数据库进行业务接管和数据恢复。

通过业务负载分担,提高系统部署的灵活性,核心系统的运行效率和核心系统运行的稳定和可靠性。应急备份中心的数据处于实时可读取状态,数据库处于OPEN状态,实现系统业务模块的重新部署。通过应急备份中心实现对核心系统的业务模块进行负载分担,将那些只对数据进行读取操作的模块都迁移到应急备份中心上来,提高数据访问的效率。

参考文献:

[1]陈开艺.连续性业务系统中容灾备份系统的建设[J].计算机时代,2007(11):22-23.

[2]陈真.常州人力资源和社会保障应急备份中心可行性报告[R].常州市人力资源和社会保障局,2011.

[3]郭敏,郭靖.Oracle 10G数据库性能优化的研究[J].武汉理工大学学报,2005,27(10):103-105.

上一篇:一种用于真空贴合的视觉定位机械手设计及应用 下一篇:液晶显示的一体化应用