数据容灾备份初探

时间:2022-05-18 10:56:40

数据容灾备份初探

摘要:容灾备份是企业和机构的数据处理应对灾难的有效手段。本文围绕容灾备份,介绍了IBM SHARE 78标准的7个层次和磁带备份的三种基本模式,并比较了在远程容灾备份过程中磁带备份和磁盘备份的优缺点。

关键词:容灾技术;灾难恢复;IBM;SHARE 78标准;数据备份

中图分类号:TP309.3 文献标识码:A 文章编号:1007-9599 (2012) 16-0000-02

容灾是一个范畴比较广泛的概念,广义上,我们可以把所有与业务连续性相关的内容都纳入容灾。容灾是一个系统工程,它包括支持用户业务的方方面面。而容灾对于IT而言,就是提供一个能防止用户业务系统遭受各种灾难影响破坏的计算机系统。容灾还表现为一种未雨绸缪的主动性,而不是在灾难发生后的“亡羊补牢”。

备份是指用户为应用系统产生的重要数据(或者原有的重要数据信息)制作一份或者多份拷贝,以增强数据的安全性。因此,备份与容灾所关注的对象有所不同,备份关系数据的安全,容灾关心业务应用的安全,我们可以把备份称作是“数据保护”,而容灾称作“业务应用保护”。备份最多表现为通过备份软件使用磁带机或者磁带库将数据进行拷贝,也有用户使用磁盘、光盘作为存储介质;容灾则表现为通过高可用方案将两个站点连接起来。

1 容灾技术

根据IBM公司SHARE 78标准,容灾技术可以分为7个层次(7 Tiers for Disaster Recovery Solution),从无任何容灾备份措施,到将备份的磁带存储在异地,再到建立应用系统实时切换的异地容灾备份中心,数据和应用的恢复时间从数天到几个小时甚至几秒。

真正的容灾必须满足三个要素:先是系统中的部件、数据都具有冗余性,即一个系统发生故障,另一个系统能够保持数据传送的顺畅;其次,具有长距离性,因为灾害总是在一定范围内发生,因而充分长的距离才能够保证数据不会被一个灾害全部破坏;第三,容灾系统要追求全方位的数据复制,也称为容灾的"3R"(Redundance、Remote、Replication)。所以实现以下要求:无异地备份;实现异地备份;热备份站点备份;在线数据恢复;定时数据备份;实时数据备份务;零数据丢失。具体实现方式如下。

2 磁带备份

在服务器上存有关键任务型数据的跨国企业需要为它们的应用提供不间断的可用性。为了防止数据受损,这些数据至少应当定期备份到磁带。但是,不断增长的数据容量需要更大的存储容量、更快的服务器,也需要更长的备份时间。用户还必须考虑到,花几个小时进行备份意味着需要用相同的时间来进行恢复。用户往往无法接受这么长的恢复时间,因为它会导致停机时间的延长,从而导致收入的损失。因此,在很多情况下,磁带备份被视为是灾难恢复计划的最低等级。尽管复制技术可以帮助一个企业更快地从灾难性故障中恢复,但是它也存在一定的限制,例如它会将受损数据和有效数据一同复制。因此,企业仍然需要进行磁带备份,以存档有效数据。

2.1 网络备份模式

在今天的企业环境中,大多数应用服务器都是通过并行SCSI直接连接到专用的磁带驱动器上。因为需要管理的磁带设备的数量与应用服务器的数量成正比,所以专用资源的部署和维护成本都很高。但是,直接连接的磁带驱动器可以保障性能,因为服务器是唯一使用驱动器的设备。成本因素促使企业转向网络备份模式,即磁带驱动器放置在一个LAN上,供多个服务器共享。在一个典型的基于LAN的备份模式中,数据和备份流量都会通过相同的LAN传输。这种网络备份模式有助于提高磁带的利用率和可管理性,但是也会带来一些问题,需要备份的大量数据会增加LAN上的流量,导致应用性能的降低。

让备份和应用流量都通过LAN传输,就可能会导致备份中断,进而导致备份任务全都失败。

备份和数据应用共用同一个LAN经常会导致很高的成本,因为一个环境的固件升级或者不稳定性可能会导致另外一个环境的中断。为了在一个共同的LAN中消除这些潜在的冲突,应当将应用和备份隔离开。在较新的部署中,客户正在向无需LAN的架构转型,以便隔离备份流量和应用。

备份需要增加应用服务器的活动,以便从磁盘获取数据和将其写入磁带。应用服务器通常忙于处理大量对延时和性能非常敏感的数据。数据的移动和调度需要占用额外的CPU周期,而进行备份通常会对应用本身造成严重的影响。无需服务器的解决方案可在应用服务器本身进行备份时,消除备份对于应用性能的影响。这种架构将移动数据和安排连接的任务交给了一个专门的备份服务器。一个强大的备份解决方案必须解决下列问题:

优化备份资源的使用,包括磁带、驱动器和工作时间;

最大限度地降低对应用流量的影响;

隔离备份域,以降低应用服务器的CPU负载。

2.2 LAN-free备份

LAN-free备份让每个应用服务器都可以通过存储网络,直接将数据移动到某个磁带设备,而不需要经过专门的备份服务器。利用通用的共享存储选项,每个应用服务器都可以充当一个介质服务器,因为它们可以直接将数据发送到磁带。每个服务器确定一个专用的磁带驱动器,并在备份过程中独占该磁带驱动器。

用户还可以利用对磁带库中磁带驱动器的专用访问权限对应用服务器进行配置,而不是使用共享选项。经过存储网络传输的数据流有助于减少LAN流量。一个磁带也可以被多个应用共享,并且可将多个备份流合并到所管理的磁带库和驱动器中。LAN仍然可以用于在备份服务器和客户端之间传输元数据和用以跟踪数据变化位置的环境表,但是实际的备份数据将通过存储网络传输。无需LAN的备份可以隔离数据域和备份域,但是不能减轻应用服务器的CPU负载,因为它们仍然需要从磁盘读取备份数据。

2.3 Server-free备份

Server-free备份需要在数据不经过应用服务器本身的情况下,将备份数据从磁盘发送到磁带。在服务器负担较轻的备份中,对所要备份数据的复制对服务器上的应用影响非常小,或者根本不会造成任何影响。数据的复本随后会智能地从磁盘发送到磁带,而不需要经过服务器。这个流量有助于减轻应用服务器的CPU负载,因为它并不处于备份数据的传输路径上。直接在磁盘和磁带之间直接传输数据的机制被称为SCSI扩展复制命令。执行扩展复制SCSI命令的组件可能位于SAN交换阵列或者服务器软件中。目前所部署的服务器负担较轻的备份(例如Legato Celestra Power和Veritas NetBackup)可以通过备份服务器管理整个流程。大部分客户目前都倾向于为备份部署专门的SAN,因为这样有助于隔离数据域和备份域。因此,他们可能不会部署这个解决方案,因为磁盘子系统和磁带驱动器必须位于同一个SAN上。

参考文献:

[1]国务院信息化工作办公室.重要信息系统灾难恢复规划指南,2005,4.

[2]San Jose Center.IBM International Technical Support Organization San Jose Center.Planning for IBM Remote Copy[R],1995.

上一篇:浅析如何培养学生的自学能力 下一篇:浅谈提高英语词汇教学有效性的教学方法