数字化校园备份与容灾方案探索

时间:2022-07-21 07:42:32

数字化校园备份与容灾方案探索

摘 要 随着高校数字化校园的广泛应用,保障数据中心的数据安全变得尤为重要。本文通过分析数字化校园对数据备份与容灾的需求,初步制定了备份策略并设计了基本的容灾方案,为日后实施具体的容灾备份指明了方向。

关键词 数字化校园 备份 容灾

中图分类号:G640 文献标识码:A

Exploration of Data Backup and Disaster Recovery in Digital Campus

YOU Junhui

(Department of Information Engineering, Guangzhou Institute of Technology, Guangzhou, Guangdong 510925)

Abstract With the widely use of digital campus in colleges, ensuring the data security of data center becomes especially important. To lay a foundation for the specific implementation of data backup and disaster recovery in the future, this paper analyzes the requirement for data backup and disaster recovery of digital campus, constitute the preliminary backup strategy and design the basic plan of disaster recovery.

Key words digital campus; backup; disaster recovery

0 引言

近年来,随着高校信息化建设的不断深入,各种维持高校日常教学管理、学生管理、行政管理等正常工作的信息管理系统不断涌现,并逐渐形成公共数据库和数据交换平台,①由高校的数据中心进行统一管理。数据存储的集中度及庞大的数据量使数字化校园建设面临着数据安全要求高、数据管理难度高、系统维护成本高等各方面压力。而目前许多高校的数据中心仍存在一些硬件平台相互独立、产品质量参差不齐、存储管理软件功能不完善等缺陷,②这进一步增加了管理海量数据的难度和数据的运维成本,严重时可能会造成数据存储设备读写性能低下,存储服务器的可扩充性和兼容性差,数据可靠性低,不利于数据的备份与恢复等问题。针对这一系列问题,需要提出一套与之相适应的数据备份与容灾方案予以解决。

1 备份与容灾应用需求

校园网数据中心承担着数据构建、保存、更新、集成、分发、共享的任务,同时提供容灾、备份等信息服务。③而数字化校园网络的数据存储与传输涉及的数据量大,数据类型复杂,构成数字化校园信息平台的教学系统、办公系统、图书馆管理系统等多个系统相互独立,数据共享难度大,信息存储分散在多个服务器上,存储资源浪费很大。这就要求数据中心具备较高的数据安全性、高可管理性、良好的可扩展性以及数据访问的连续性。

1.1 安全性需求

从数据管理的角度看,小至人为误操作导致的系统破坏及数据丢失,大至自然因素导致的火灾、地震、水灾等突发事件,都会使数字化校园的数据安全受到威胁。④这就要求备份与容灾系统具备稳定的性能和良好的安全性,要能保证当意发生时,能够及时启动备用的存储系统,以保证整体系统能够继续平稳、正常运行;另外,需要制定严密的数据备份与容灾方案,作为系统出现故障时数据能够及时恢复业务能持续运行的保障。

数据安全的威胁主要来源于硬件故障、软件故障、人为操作失误、恶意删改、自然灾害等。

针对硬件故障,一种主要的解决方案是廉价磁盘冗余阵列(Redundant Array of Inexpensive Disks, RAID)。RAID是一种通过逻辑或物理的方法将多个硬盘组建成一个新的逻辑阵列盘,将数据分散地储存在不同的磁盘中,存取数据时,阵列中的相关磁盘一起动作,以大幅减低数据的存取时间,同时获得更佳的空间利用率的技术。⑤该技术有多种级别,其中最常用的是RAID1(磁盘镜像)和RAID5(带分布式校验块的独立磁盘阵列)。RAID1的每一个磁盘都具有一个对应的镜像盘,对任何一个磁盘的数据写入都会被复制到镜像盘中,系统可以从一组镜像盘中的任何一个磁盘读取数据。RAID1的读性能好,可靠性很高,但由于其物理磁盘空间是逻辑空间的两倍,其成本也是磁盘阵列中最昂贵的一种。RAID5是在同一阵列所有磁盘上交叉地存取数据及奇偶校验信息,每块磁盘上的校验信息由其他几块磁盘上对应数据块计算得出。因此,如果一块磁盘失效,其他盘上的校验信息和数据即可经过计算重新产生失效盘上的数据,这样既提高了数据安全性,又避免了单位成本过高的问题。

针对软件故障、操作失误及恶意删改等软故障,一般采取结合数据备份恢复软件,制定相应的数据备份计划和恢复方案的解决办法。在数据正常时做好有计划的备份,记录下当前数据的状态,当软故障引起数据丢失时,即可借助数据恢复方案把数据恢复到最近一次的备份,最大程度地减少数据的丢失,保证数据的安全性和可靠性。

1.2 可管理性需求

要求整套数据备份与容灾方案能够提供人性化的可操作界面,以便对整个系统进行实时的监控、管理和维护。同时,由于存储设备多且位置分散,要求系统的管理功能能够轻易地对分散在各处的存储设备进行管理。

1.3 可扩展性需求

要求整套存储备份系统能够在系统升级时平滑地接入新的系统,同时不增加服务器和局域网的负担,具备灵活的升级能力和良好的可扩展性。

1.4 数据访问连续性需求

所设计的方案应满足整个系统不会因为某块板卡或连接线路故障而导致数据不可访问,在经费允许的情况下,应尽可能地减少系统的单点故障,最大限度地保障应用服务器对系统数据访问的连续性。

2 备份策略的制定

备份策略是指确定需备份的内容、备份时间以及备份方式。备份策略关系到数据的完整性、安全性、可靠性和有效性,并在系统软硬件发生任何故障时可以快速恢复数据。⑥一个完整的备份策略是根据实际应用环境和备份系统的特点,对备份问题进行分析,最终决策形成的一个详细的备份内容分解机对应的备份调度计划,用以实现预期目标。

2.1 备份方式的选择

目前采用的备份方式主要有以下3种:

完全备份:即对现有的所有文件都进行备份。其优点在于,当数据遭到破坏或丢失时,只要使用灾难发生前一天的备份磁带即可恢复丢失的数据(假设备份介质为磁带,且每天使用一盘磁带进行备份)。但如果每天都采用这种方式进行备份,其数据量之大可想而知,而且需要耗费大量的时间和服务器资源乃至网络资源。

增量备份:这种备份方式通常与完全备份结合使用。假设管理员在周日进行一次完全备份,在接下来的六天中每天都只对与前一天相比新增的或修改过的文件进行备份。这种备份方式既节省了存储设备的空间又大大缩短了备份处理时间。然而,一旦灾难发生,这种备份方式就会明显暴露出两大缺点:数据恢复操作繁琐和备份可靠性低。同样设每天备份都需要用到一盘磁带,假设周四早上系统发生故障造成大量数据丢失,那么数据恢复时就需要用到周日完全备份的磁带以恢复周日及之前的数据,除此之外还需用到接下来的周一、周二、周三晚上进行增量备份的3个磁带,分别用于恢复周一、周二、周三新增的或被修改过的数据,灾难发生的时间离完全备份的时间越远恢复起来就越麻烦,用到的磁带和恢复操作就越多。

差异备份:这种备份方式也通常与完全备份结合使用。同样假设管理员在周日进行一次完全备份,但与增量备份所不同的是,在接下来的六天中每天都只对与周日相比新增的或修改过的文件进行备份。这种备份方式与增量备份相比,同样也无需每日进行完全备份,能够大大节省备份的时间和存储设备空间,而且在进行数据恢复时避免了增量备份方式带来的操作繁琐,只需使用最近一次完全备份和最近一次差异备份的磁带就能进行数据恢复,所需的磁带少,且可靠性更高。

在实际应用中,备份策略通常采用完全备份+增量备份或完全备份+差异备份的结合形式,鉴于上面提及的增量备份的缺点,建议选择后者的结合形式。

2.2 备份策略实施关键

备份策略具体应如何实施需与不同服务器的功能及其所存数据的用途和重要性相结合来进行安排。在进行具体实施时,需注意以下几个关键点:首先,由于数据量大,使用网络备份系统无可避免,但也不能完全依赖网络备份系统,尤其对关键数据而言,必需采用至少两种备份方法,比如除了借助网络备份系统进行备份之外,还可采用操作系统备份方法作为软件备份的补充,这样即使网络备份系统运作失效也可保证当日有一份备份成功。其次,备份时不要只备份到磁带,而应先备份到硬盘,再备份到磁带。数字化校园中某些重要系统如OA系统的数据实时性较强,需要在短时间内进行备份和恢复,要求取得较短的恢复时间。由于磁带是脱机存储介质,数据库崩溃时,若从磁带恢复数据到硬盘需要较长的传输时间,但如果备份时先备份到硬盘再备份到磁带,那么当数据库崩溃时就可以直接使用硬盘中的备份进行恢复,节省了数据从磁带读入到硬盘的时间,从而减少了平均恢复时间。再者,应考虑定期把关键应用数据转移到异地,以确保本地服务器遇到灾难性事件后本地关键数据能得以恢复。

3 容灾方案初步设计

由于我校建有多个校区,为应对不可抗力灾难情况发生,除了需要进行常规的本地备份之外,还需进行异地灾难备份。为实现主校区和分校区间的数据级容灾,可将主存储系统设置在数据中心所在校区,备份存储系统放置在另一校区。

根据我校数字化校园建设现状及要求,初步建议数据中心配置一台在线主存储系统,该系统中配备一套虚拟化数据管理平台。而容灾中心的备份存储系统中设置一套虚拟化数据管理系统。

为保证对在线存储中重要数据的容灾,利用该虚拟化数据管理平台中的远程复制模块将现有存储设备中的数据按照事先设定的策略通过IP网络传输到远程容灾存储系统的存储池中。每次数据复制只复制上一次复制后的变量数据,以降低网络带宽占用量。由于数据直接通过虚拟化平台传输到远程,中途无需经过任何应用服务器,因此可以实现远程复制过程中对应用服务器的零干扰。

为主存储系统和备份存储系统配备时间点连续数据保护功能,对存储设备中的重要数据进行连续的时间点备份,保存数据在不同时间点的多个备份版本。一旦数据中心存储系统遭受灾难时,即可对不同备份版本的数据进行检查,最终把数据恢复到离灾难发生之前最近的时间点。

以上采用的主备存储方式理论上可支持各校区服务器的共同使用,遇到灾难可以快速恢复业务。

4 结束语

以上所提出的备份与容灾方案仅为初步方案,理论上能够满足我院数字化校园对容灾备份的基本要求,可为日后的容灾方案详细设计及软硬件设备的选择提供参考方向。

注释

① 左锋,宋艳.数字化校园数据备份体系建设探索[J].计算机与网络,2012(20):51-53.

② 汪宏伟.基于SAN的高可靠性校园网络信息存储系统的设计[J].情报探索,2006(2):54-56.

③ 吝春妮.数字化校园中数据中心建设与数据库安全[J].软件导刊,2011(4):163-165.

④ 徐震.数字档案馆数据备份系统方案的规划[J].兰台世界(理论版),2006(9):21-22.

⑤ 何欢,何倩等.数据备份与恢复[M].北京:机械工业出版社,2010.

⑥ 魏评.高等学校网络中心数据备份策略及其实现[J].电脑知识与技术,2008(20):317-319.

上一篇:论新时期大学校园文化建设 下一篇:培养高素质创新人才的思考