数据集中备份与恢复方案的探讨与实现

时间:2022-06-22 09:46:30

数据集中备份与恢复方案的探讨与实现

摘要:如何在一定投资预算的情况下对数据进行快速备份、快速恢复,是每个系统维护及管理人员面临的一个难题。该文根据湖北联通的现状,设计实现了一种集中的备份恢复方案,在实际使用中取得了较好的效果。

关键词:集中;备份恢复;实现

中图分类号:TP311文献标识码:A文章编号:1009-3044(2008)32-1037-02

1 引言

作为目前国内唯一的全业务运营商,联通经过这么多年的快速发展,业务支撑系统繁多。在湖北联通,仅营帐、CRM、专业计费、经营分析、商管理等各种大的系统就有40余套,各类数据文件、数据库归档日志加起来20T左右。拥有AIX、SOLARIS、LINUX等多套操作系统及ORACLE、SYBASE等多套数据库。海量的数据、复杂繁多的系统,使得数据的备份与恢复成为系统维护管理中的难点。传统独立的人工备份方式,由于其备份、恢复效率较低,管理复杂,已不能满足湖北联通系统备份和恢复工作的需要。湖北联通急需设计一套能够及时备份、恢复的数据备份方案

2 传统备份架构探讨

目前社会上常用的备份架构主要有Host-Base、LAN-Base、LAN-Free、Server-Free等,各种备份架构的主要特点如下:

2.1 Host-Based架构

Host-Based是传统的数据备份架构。这种结构中磁带库直接接在服务器上,而且只为该服务器提供数据备份服务。在大多数情况下,这种备份是采用服务器上自带的磁带机,而备份操作往往也是通过手工操作的方式进行的。

Host-Based备份架构的优点是数据传输速度快,备份管理简单,特别是对于系统文件的恢复较快,不依赖于其它环境和网络;缺点是备份数据量有限,不利于备份系统的共享,不适合于现在大型的数据备份要求。

2.2 LAN-Base架构

LAN-Based架构是基于网络的一种备份结构。备份时配置一台服务器作为备份服务器,由它负责整个系统的备份操作。磁带库则接在某台服务器上,在数据备份时,数据通过网络传输到磁带库中实现备份。

LAN-Based备份架构的优点是节省投资、磁带库共享、集中备份管理;它的缺点是备份和恢复依赖于网络环境,对网络传输压力也较大。

2.3 LAN-Free架构

LAN-Free架构是指在备份时,为提高用户网络性能,而选择另外一条通路进行数据备份。LAN-Free可以根据设备和网络结构的不同形式,以很多方式实现。通常,需要为每台服务器配备光纤通道适配器,适配器负责把这些服务器连接到相连的SAN(存储区域网)上。同时,还需要为服务器配备特定的管理软件,通过它,系统能够把数据从服务器经SAN传输到磁带库中。

在LAN-Free架构的备份中,LAN-Free的备份系统是建立在SAN的基础上的,数据备份统一管理、备份速度快,由于备份数据的传输不经过LAN网络,网络传输速度大大提高,一般备份速度能提高2.5到10倍。

但LAN-Free架构也有不足,它仍就让服务器参与了将备份数据从一个存储设备转移到另一个存储设备的过程,在一定程度上占用了CPU和服务器内存。还有一个问题是,LAN-Free技术的恢复能力依赖于系统环境及备份软件的功能,例如如果系统盘出现故障,部分基于LAN-Free架构的备份软件不能进行有效恢复,需要安装基于裸机的备份和恢复软件。LAN-Free的实施比较复杂,需要相应的系统软件及硬件设备支持。

2.4 Server-Free架构

Server-Free是LAN-Free架构的一种延伸,它不需占用备份主机的CPU资源,备份过程能够在SAN内部完成,而大量数据流无需流过服务器,可使数据能够在存储阵列及备份带库(或其它设备)之间直接传输。

Server-Free与LAN-Free备份有着诸多相似的优点。虽然服务器仍参与备份过程,但负担大大减轻,因为它不是主要的备份数据通道。Server-Free备份技术具有缩短备份及恢复所用时间的优点。因为备份过程在SAN网络上进行,而且决定吞吐量的是存储设备的速度,而不是服务器的处理能力,所以系统性能将大为提升。

Server-Free架构也有缺点,这种架构虽然服务器的负担大为减轻,但仍需要备份应用软件来控制备份过程,还是需要占用一定的CPU资源。而且,Server-Free备份可能难度更大、成本更高(需要购买相应的软件、硬件)、管理也最复杂。该种备份方案还在不断完善过程中。

3常用备份介质探讨

传统的备份介质是磁带,但磁带备份也有一些缺点,它的备份功能比恢复功能强,恢复能力较弱。由于磁带机的传输速度增加,因此备份时要特别小心调整写入磁带的数据流,以避免磁带在开始、进行中及定位时产生“摩擦(shoe shine)”效应。一般磁带备份都支持多任务处理,以提升备份的速度,但是多任务却会降低恢复的速度,因为恢复时,系统需要多花时间读取属于自己任务的那个备份映像。磁带备份还有一个问题,它的备份质量并不稳定。在操作过程中,有可能数据已经全部备份成功,但是,却很难验证磁带内所有数据是否都可以恢复。

另外一种常用的备份介质是磁盘。与磁带相比,磁盘具有许多优点。 首先,和磁带机不同的是,磁盘不需要稳定的数据流。即使采用只存储少量数据的增量备份,也没有“摩擦”效应。第二,磁盘允许系统管理员进行全部数据备份工作(Full Backup),而不用忍受执行速度变慢的后果或增加恢复资料时损坏的风险,可以加快整体备份的速度。另外,磁盘在恢复数据方面非常优秀,无论是在可靠性还是在执行速度上。以磁盘驱动器接口规格为主的磁盘阵列,让磁盘成为比磁带更可靠的介质。质量不好的磁带会让整个恢复操作失败,而有了磁盘阵列保护功能,即使磁盘损坏,也可以成功地将数据恢复。 尽管磁盘有上述这些优点,但与磁带比较起来,磁盘主要缺点就是,磁盘的价格要高于磁带。

VTL是虚拟磁带库的简称(Virtual Tape Library)。VTL是近年来兴起的众多磁盘备份(Backup to Disk)解决方案中,最受瞩目的一项。VTL既具有磁盘的优点,又具有磁带的特性。它能够模拟标准磁带库,让现有的备份数据能够使用磁盘而不是磁带来做数据备份的介质。通过使用磁盘,用户能够得到更大的数据吞吐性能、更高的可靠性、数据保护能力和快速恢复能力,减少机械和人为操作导致的错误,而且不必改变已有的备份策略和操作过程。大部分VTL还具有硬件压缩功能,通过硬件压缩数据,在不影响数据备份速度性能的情况下,将同一硬盘的存储容量增加2至3倍,因而大大节省磁盘成本。VTL一般还具有重复数据删除功能,在做数据备份时,此项功能一般可增加存储10倍以上的空间。但由于重复数据删除时,一般采用一些特定的算法分析是否为重复数据,因此理论上存在误删的可能。

其它常用的介质,还有光盘、软盘等,但综合考虑成本、管理及技术成熟度等因素,在大型数据备份时使用案例不多。

4 湖北联通数据集中备份恢复方案的实现

数据备份不仅是对数据进行保护,更重要的是在系统遇到人为或自然灾难时,能够通过备份对系统进行有效的灾难恢复。在设计备份方案和备份策略时,首先考虑恢复点目标(RPO)和恢复时间目标(RTO),恢复点目标是指数据和系统必须恢复的时间。恢复时间目标是指灾难发生后恢复业务所需的最长时间。各系统恢复要求为:核心系统24小时内恢复,重要业务支撑系统48小时内恢复,一般系统RTO可以达到48小时。

可以看出,湖北联通系统备份面临的主要问题有:数据量大,且核心系统恢复时间(RTO)短;系统较复杂,既有各种类型的操作系统、数据库文件,也有各种数据文件、数据库归档文件。传统的备份方式很难满足系统备份恢复的需要。根据湖北联通现状,必须结合现有的各种备份技术,才能设计出既能满足符合RPO和RTO要求,又能兼顾投资成本的备份方案。湖北联通设计了集中的备份方案,采用Veritas的NetBackup备份软件,系统架构以LAN-Free为主, Host-Based、LAN-Base为辅,备份数据实现分级存储,核心系统数据备份到VTL,非核心数据备份到带库。方案拓扑结构如图1。

在该方案中,湖北联通重要的系统为LAN-Free架构,服务器上安装NetBackup系统管理软件作为主服务器,重要系统的数据以LAN-Free的架构通过SAN交换机直接备份到VTL或磁带库STK L700e。一般系统为LAN-Base架构,数据通过LAN网络备份到STK L700e带库上。具体方案如下:

4.1 备份软件的部署

根据湖北联通多平台、多数据库现状及技术要求,湖北联通选用了Veritas的NetBackup 备份软件。VERITAS 的NetBackup软件具有四层体系结构,可以满足大型数据备份的需求。第一层的NetBackup主服务器(Master Server)用于进行规划和跟踪客户机备份;第二层的介质服务器(Media Server)提供大型应用的本地备份。介质服务器可以与主服务器或另一个介质服务器共享磁带库;第三层为客户端(Client),主要对服务器和工作站进行备份。第四层Global Data Manager可对企业内部的所有NetBackup存储域进行集中的管理与控制。

湖北联通在部署综合备份软件时,先将一台IBM小型机作为备份服务器MASTER SERVER,服务器上安装三种软件,分别为:NETBACKUP SERVER,负责备份策略的制订、管理、维护等工作;NETBACKUP LIBRARY SUPPORT,用于对磁带库中磁带机设备的支持;NETBACKUP SHARED STORAGE OPTION,用于在SAN环境中对磁带机共享的支持。

在客户端,根据系统的重要程度、RTO时间不同,安装不同的备份软件:1) 核心系统,如营帐数据库主机,安装以下软件:Bare Metal Restore Client,用于裸机灾难恢复; NETBACKUP SAN MEDIA SERVER,用于对磁带库的管理、驱动及基于SAN备份的支持;安装NETBACKUP ORACLE AGENT,用于对ORACLE数据库的在线备份。2) 一般系统,根据备份方案的不同安装不同的软件:基于LAN―Free架构备份的,安装NETBACKUP CLIENT及NETBACKUP SAN MEDIA SERVER;基于LAN-Base架构备份的,只需安装NETBACKUP CLIENT。NETBACKUP CLIENT用于服务器与备份服务器之间建立通讯联系,并提供文件系统备份的功能。NETBACKUP SAN MEDIA SERVER 用于支持基于LAN-FREE架构的备份。

所有需要备份的系统,都在Master Server上制定统一的备份策略,通过Netbackup,对支撑系统的备份工作进行集中的管理、监控。

4.2 数据备份架构的设计

湖北联通业务支撑系统均具备LAN-Base的备份条件。对于RTO时间在48小时以上的一般支撑系统,湖北联通采用LAN-Base架构的备份方案。对于部分数据量较大的核心业务系统,如果采用LAN-Base的备份方案,不仅系统备份及恢复的时间较长,而且由于系统备份时大量占用网络资源,会严重影响业务系统的性能。对于这部分业务系统,湖北联通组建了SAN的存储网络,采用了LAN-Free的备份方式。

由于LAN-Base和LAN-Free的备份方式都依赖于系统环境,特别是系统网络环境,在系统遇到重大故障或灾难时,部分基于LAN-Base和LAN-Free方式备份的数据就难于恢复。对于一般系统操作系统的备份,湖北联通仍采用了传统的Host-Based的备份方式。系统一旦出现故障,先用传统的Host-Based方式恢复系统,再通过LAN-Base和LAN-Free方式恢复业务数据。对于核心系统,由于安装了NETBACKUP SAN MEDIA SERVER,平时基于LAN-Free进行备份,出现灾难时可基于LAN-Free进行系统及数据恢复。

4.3 备份数据分级存放

在前面比较备份介质时,我们可以看到,磁带价格低廉,备份速度快,但存在恢复速度慢,不易验证的缺点。磁盘备份读写速度快,但价格较高。VTL也是一种磁盘,但具有硬件压缩功能及磁带功能特性。通过分析RPO及RTO,以营帐系统为例,5T左右的数据若需要在24小时内恢复,按照最快的数据库采用归档备份的恢复方案,至少需要在12小时内恢复数据,剩下的时间恢复数据库,恢复业务。按照这个时间要求,带库恢复速度至少要达到118m/s。但目前采用LAN-Free进行数据恢复的最快速度为60m/s。因此,完全采用带库并不能在规定的时间恢复系统。综合考虑系统恢复时间(RTO)及备份系统成本,湖北联通采用了备份数据分级存放的方案。核心备份数据存放在VTL上,其余备份数据存放在STK L700e的带库上。即在Veritas NetBackup的Master Server的控制管理下,核心的营帐系统系统数据以LAN-Free的方式通过SAN交换机直接备份到VTL,专业计费等重要系统的数据以LAN-Free或LAN-Base的方式直接备份到磁带库STK L700e。通过以上的备份数据分级存放,湖北联通核心业务系统恢复时间均可满足RTO要求。

4.4 带库及VTL的选择

由于核心的备份数据都存放在VTL上,要求VTL除具备快速备份和快速恢复特性外,数据的可靠性是重点考虑的问题。因此在选择VTL上,湖北联通并没有选择带有重复删除功能的VTL,而选择了具有压缩功能的VTL。

带库作为主要的备份载体,存放着主要的备份数据,根据业务数据量、数据备份恢复时间要求,湖北联通备份系统选用了目前市场上成熟度较高的StorageTek公司的L700e 磁带库,配有8个LTO2磁带机。

5 结束语

湖北联通业务支撑系统数据集中备份恢复方案具有以下特点:

1) 实现了全省业务支撑系统的集中备份管理

2) 完全满足RPO和RTO的要求

3) 实现备份数据分级存放

4) 结合了各种数据备份技术及方案

采用了Host-Based、LAN-Based、LAN-Free多种备份架构;

实现了基于带库和VTL的集中备份方案;

利用NETBACKUP ORACLE AGENT软件,结合RMAN及数据库归档,实现了ORACLE数据库的实时备份。

5) 具有较高的性价比

由于采用了备份数据分级存放及各种备份技术,既满足了备份、恢复的需要,又控制了成本。

参考文献:

[1] 叶硕累.存储区域网SAN的基本结构和应用环境[J].科学论坛,2005(17):31-32.

上一篇:基于Windows系统的Moodle教学平台构建 下一篇:RIP欺骗――企业内部网潜在的危险