论述我厂信息系统虚拟化应用

时间:2022-02-03 05:41:33

论述我厂信息系统虚拟化应用

【摘要】企业信息系统是现代企业运营的基础平台,数据则是关系到客户和企业利益的核心资源,业务连续性和数据可用性是关系到企业生存的重要问题,建立容灾系统能使企业在遭遇意外灾难时,保障业务的连续性,最大程度地降低损失。本文通过对虚拟化技术的分析论述了服务器虚拟化的应用以及IBM公司的ERM镜像系统实现在线备份的过程及实施步骤,分析了VMware SRM在容灾备份中的特点和优势进而实现信息系统应用业务的连续性,可靠性。

【关键词】服务器虚拟化;灾难备份;异地容灾

1.虚拟化概述

1.1 概述

随着IT技术的快速发展和应用的挑战,电厂信息化正处转型阶段,对于电厂信息化能力也提出了更高的要求,特别是虚拟化、物联网、云计算等新兴技术被纷纷引入信息化建设,为新一代的信息系统提供更加稳定、完善、高效的技术支撑。

虚拟化技术一直被视为企业迈向云计算的第一步,是云计算的技术的基石。严格来讲,虚拟化是一门应用很广泛的技术,是将实体进行逻辑抽取转化成为抽象体的一个过程,借助虚拟化技术能实现对物理层状态复杂性的屏蔽,使系统对外运行状态呈现出简单的逻辑状态;是增加资源利用和提高资源效率的最强大工具之一,同时使企业能够更好地从战略角度发展云计算模式。它最大的特点不仅可以提高业务连续性和数据安全性,还可以对业务集中管理,提高数据中心和桌面环境的管理效率,使工作负载变得易于部署,使各应用独立开来,提高配置管理,缩短甚至消除计划和非计划的停机时间,增强业务的连续性,减少错误发生并使信息系统获得更低的消耗以及更低的风险。

虚拟化正在迅速成为管理高效IT环境的标准方式,它不但改写了计算规则,又对存储和网络的变革起了推动作用。

1.2 我厂虚拟化应用现状

第一阶段,实现服务器虚拟化。采用服务器虚拟化技术将信息中心分别运行在十几台服务器的应用系统迁移至由2台IBM高性能服务器及一台IBM存储柜搭建的服务器平台中,管理人员只要事先做好快照和虚拟机的部署模板,在服务器宕机时,只需恢复快照和重新部署一次模板即可,服务器的使用效率和灵活性大大提高,运维和管理也非常方便。

第二阶段,实现灾难备份,行政楼配置有4台物理服务器跑着40个虚拟机,2台IBM B24光纤通道交换机,1台IBM DS5020替换原IBM DS 3400。信息中心机房的DS5020通过IBM远程磁盘镜像复制技术ERM,将数据镜像复制到生产楼灾备机房的DS5020,在两套磁盘存储设备间建立磁盘镜像复制关系从而实现高可用性,保证关键数据的可恢复性与业务应用的可持续性。

第三阶段,实现异地容灾。采用VMware vCenter SRM(Site Recovery Manager―站点恢复管理)软件实现异地容灾。SRM是VMWARE的一个软件包,它同VMWARE虚拟化架构无缝连接,其功能为在主站出现灾难环境后能在异地的从站迅速恢复主站灾难前运行的虚拟架构,恢复受保护的虚拟机,立即恢复运行,保证业务的连续性。

2.虚拟化阶段实施过程

2.1 实现灾难备份

2.1.1 概述

第一阶段以资源整合和节约成本为目的,通过对边缘应用及非核心应用进行虚拟化,是将虚拟化技术引入信息系统的第一步,同时对虚拟化平台进行实际验证也帮助我们熟悉虚拟化平台的运维管理,为进一步扩大虚拟化平台范围打下基础。具体实施过程通过服务器虚拟化的实施将数据库、中间件分开,每个应用都拥有一个相对独立的运行环境,软件之间不会相互影响,从而保证了所有应用的稳定性和安全性。

随着第一阶段完成服务器虚拟化部署,第二阶段将部分业务应用改造并部署到虚拟化平台上,实施灾难备份系统。

虚拟化技术为灾难异地备份的发展起到了很大的作用。在灾难备份系统建设中虚拟化软件的优势是十分明显的。通过允许虚拟机在物理服务器之间进行无缝迁移,在灾难发生时能使业务保持连续,提供关键性的灾难恢复计划。

我们采用智能存储设备IBM DS 5020实现硬件级别的数据复制,自带数据复制技术Enhancement Remote Mirror(简称ERM),无需占用主机设备的系统资源。生产中心和备份中心的存储设备的硬件平台都是DS 5020磁盘存储系统。另外,基于数据复制系统在搭建数据链路时,采用了基于FC 的光纤裸链路,其数据的传输性能可以得到保证,提供了最可靠、最经济高效并且最简单的灾难保护。

2.1.2 容灾备份目标:

保证我厂关键信息应用系统在最接近的时间内,复制到远端生产楼的备份设备,防止因灾害发生引起重要数据的丢失。

采用IBM DS5020 两个阵列在VMware应用环境下,实现异地存储备份。

通过关于关键信息应用系统的远程存储备份,实现在信息中心主机不能正常运行情况下,生产楼的远程备份接替关键应用系统的工作。

2.1.3 我厂容灾备份方案特点:

(1)对物理主机及虚拟机的完整保护:与VMware vSphere完全集成 实现7×24小时备份及可用性;

(2)集成VMware vSphere提供持续可用性:

a.通过最新的完整备份,从虚拟机恢复系统及服务

b.三个简单步骤:10分钟完成物理主机到虚拟机(P2V)转换,可实现在线P2V转换,立即启动备份服务器

(3)直接升级到远程容灾机制:

a.直接将完整VMware系统及数据复制到灾备中心,有效利用硬件资源

b.利用IBM DS5020存储的数据复制技术Enhancement Remote Mirror(简称ERM)技术实现存储级别的硬件级数据传输

c.利用VMware SRM快速实现站点间的切换

图1 灾难备份拓扑结构图

2.1.4 灾难备份实施

IBM DS 5020存储系统支持实现跨越两个站点的DS 5020 存储系统之间,进行数据复制的能力,包括同步拷贝、异步拷贝与异步一致性组拷贝功能。这种功能称之为Enhanced Remote Mirror(ERM)。

实施过程中,我们通过ERM增强的远程磁盘镜像复制技术---Metro Mirror(同步的镜像模式),在两套IBM System Storage DS5020磁盘设备间建立数据复制关系。对于主机来讲,活动状态的存储设备只有一台。这台存储设备使用硬件复制技术和备份磁盘之间进行数据复制,保持两个存储设备上的数据一致。

存储系统的数据复制对于主机来说是透明的,其自身的优点是,由于它是基于存储设备来实现整个系统的数据复制,因此,它对主机系统的资源没有消耗,可以保证相关主机上的应用高性能运行;另外,基于数据复制系统在搭建数据链路时,我们采用了基于FC的光纤裸链路,不管是采用同步或异步的传输方式,其数据的传输性能可以得到保证。同时,每个DS 5020存储系统的控制器需要使用专用的,即每个控制器最后一个主机端口用于远程拷贝连接。同时还规划了相应的Zone。就用于ERM连接的Zone而言,本地DS 5020存储系统的控制器A 要与远端DS 5020存储系统的控制器A 划成一个Zone,本地 DS 5020存储系统的控制器B要与远端DS5020存储系统的控制器B划成一个Zone。

在具体实施过程中,为保证数据的安全、可靠,我们将行政楼IBM DS 5020中的数据备份到生产楼的DS 5020中。由于两楼之间距离约300米并配有光纤连接,在选择IBM的ERM备份软件的工作模式时选用同步镜像工作模式,这样两台DS 5020中的数据保持同步一致。同样的数据在两地各有一份,这样就大大增加了数据的安全性和可靠性。

2.2 容灾技术方案

2.2.1 概述

随着社会的发展和科技的进步,企业越来越依赖于数据处理来进行业务运营,业务的连续运营依赖于IT系统的稳定运行。然而,灾难就像灰尘一样伏击在企业周围,任何企业的信息系统可能可能面临突如其来的灾难:

如果不能对风险采取有效治理,一旦数据由于上述某种原因丢失,就有可能造成整个企业在运营上的重大不便和经济损失。

由此可见,保证企业的业务连续运营及数据处理的高可靠性和高可用性已经成为我厂信息系统首先要考虑的问题,以便在发生系统灾难后能够从容应对风险。一个坚实的 VMware 灾难恢复计划对应用发生中断后如何进行故障切换并恢复工作及对保护企业的数据和业务操作是至关重要的。

为此,我们开始第三阶段的异地容灾系统并为系统设立了如下目标:

数据与存储系统的高可用性,保证数据7X24小时的连续访问;

将现有的存储技术集成,创造出一种更有效的数据存储管理,实现高效、高可靠性、低成本的数据管理;

需要对企业现有的数据库、邮件系统、文件服务器以及各种应用系统进行集中化、自动化的基于策略的保护;

采用一套成熟度高,业内应用广泛的企业级软硬件整体解决方案;

这些目标的实施保证一旦发生灾难(洪水、地震、火灾等),或者人为灾难(用户失误、磁盘失效等)导致数据丢失或者业务中断时,能够快速、及时地恢复数据,保证业务的连续运行。

从开始实施虚拟化以来,容灾系统就在规划之中,经过多方考察,我们认为VMware? vCenter? Site Recovery Manager能够满足我厂的异地容灾需求。

VMware? vCenter? Site Recovery Manager作为 VMware vSphere 的有益补充,可确保为所有虚拟化应用程序提供最简单、最可靠的灾难防护。Site Recovery Manager 提供经济高效的内置vSphere Replication,并支持使用广泛的基于存储的高性能复制产品集将虚拟机复制到辅助站点。

对于我厂的容灾方案来说,即当行政楼信息中心系统出现问题后生产楼的系统能够迅速启动恢复运行,以保持业务的连续性。

根据这种要求生产楼配备了与行政楼几乎同样的硬件配置,包括多台物理服务器,光纤通道交换机,存储设备以及VMWARE Site Recovery Manager软件系统。

2.2.2 VMWARE SRM虚拟化容灾方案的优点

SRM(Site Recovery Manager―站点恢复管理)是VMware的一个软件包。它同VMware虚拟化架构无缝连接,其功能为在主站出现灾难环境后能在异地的从站迅速恢复主站灾难前运行的虚拟架构,恢复受保护的虚拟机,立即恢复运行,保证业务的连续性。其优点在于:

・ 提供内置 vSphere Replication 进行简单、经济高效的复制。

・ 支持针对大型、关键业务环境的基于存储的众多复制产品。

・ 自动执行灾难恢复和迁移流程以确保快速、可靠的恢复。

・ 简化计划内迁移和预防性故障切换。

2.2.3 容灾硬件配置及SRM的应用

(1)物理服务器

生产楼配置3台物理服务器,并且每台具有足够的CPU数量及内存容量。以保证能够生产相应数量的虚拟机,以便对行政楼主要应用的虚拟机进行迁移保护。

每台服务器配备双HBA卡,以实现硬件冗余。

(2)光纤通道交换机

配备2台IBM B24光纤通道交换机,以实现链路冗余。

(3)存储阵列

IBM DS 5020已配备,并已进行数据同步镜像(通过ERM),工作正常。

(4)VMWARE SRM容灾软件包

Site Recovery Manager 5 Standard 可用于保护每个站点和每个Site Recovery Manager 实例中的最多75个虚拟机。

2.2.4 实施步骤

・完成生产楼服务器、光纤通道交换机的安装调试。

・生成生产楼服务器、光纤通道交换机及存储DS 5020之间的链路连接,并对链路进行测试,保证链路连接正确及连通无误。

・进行Zone的划分。

・选取行政楼具有重要应用意义的12个虚拟交换机做为SRM在发生灾难时向生产楼迁移的对象。

・在生产楼安装Vcenter,并由Vsphere生成相应数量的虚拟机。

・对生产楼的虚拟机进行LUN映射并测试每个虚拟机工作正常。

・在行政楼和生产楼安装SRM。

・对容灾SRM进行模拟故障切换,进行测试,以保证在发生灾难时能够正常启动,工作正常。

3.结论

经过三个阶段虚拟化的硬件部署、软件升级、应用的实施,我厂虚拟化建设已初具规模并在信息系统中发挥着关键作用:

通过服务器虚拟化的实施,实现整合服务器、操作系统、应用平台,对服务器资源进行统一管理;实现按需分配资源,简化了管理的复杂性,极大地提高了工作效率。

存储高可用:通过IBM EMR Metro Mirror(同步的镜像模式)远程磁盘镜像复制技术,在两套IBM System Storage DS5020磁盘设备间(信息中心机房及生产楼机房各一套),建立磁盘镜像复制关系从而实现存储高可用性,从而建立完善的存储备份中心,保证关键数据的可恢复性与业务应用的可持续性。

使用VMware vCenter Site Recovery Manager确保高度可靠的RTO和RPO,并且成本和复杂性程度远低于传统灾难恢复方法。借助 Site Recovery Manager,可以将灾难防护扩展到在vSphere平台上运行的所有应用程序。

IBM DS5020的远程磁盘镜像复制技术ERM和VMware的SRM的完美结合,为我厂关键信息应用系统构筑了安全、可靠、高效的存储备份体系。

未来我们将不断摸索网络虚拟化和云计算技术,专注点将主要集中在虚拟化实现云计算的基础,将已有的虚拟化X86服务器建设成一个资源池,并且有计划、有规模的梳理现有的各种应用,实现应用按需申请资源;其次,未来将逐步实现系统开发、上线、监控、运维、管理、容灾等实现应用平台云化,以便跟上即将到来的SDN(软件定义存储)的时代。

参考文献

[1]Muller,A1(EDT)/Wilson,Seburn/Happe,Don/Hummphre,Gary j.,With Vmware ESX Server [M].by Elsevier Science Ltd,2010.

[2]虚拟化应用手册 IBM研究院,2012.

作者简介:阎立波,工程师,现供职于华能国际电力股份有限公司上安电厂,研究方向:虚拟化存储在信息系统中应用和实施。

上一篇:基于MCGS的YL―335B仿真设计与实现 下一篇:技术档案资料信息化管理探讨