操作系统集中备份恢复技术研究

时间:2022-07-18 10:03:25

操作系统集中备份恢复技术研究

摘要:本文对操作系统的备份恢复现状中遇到的问题进行了分析,对相关软件的功能、优势、备份所需要的环境、备份的模式、实施流程进行了介绍。

关键词:操作系统备份;CSM

中图分类号:TP309.3 文献标识码:A 文章编号:1674-7712 (2012) 10-0103-01

一、操作系统备份恢复现状

在日常维护过程中,根据内控的要求,对于主机的操作系统要三个月备份一次,除此之外在操作系统发生重大变化的前后都要进行备份,整个信息支撑系统的需要备份的主机多在达200多台,而且还在不断地增加,利用现在传统的磁带备份模式,重复的工作量是非常巨大的。而且磁带的备份模式本身就存在很大的不稳定性,能否可恢复都是不可预知的。其中以IBM的设备为例,涉及到的系统多,机型多,包含P4、P5、P6等,有的有内置磁带机,有的没有。这么多的主机,为保险起见,每台至少需要两盘小磁带做备份,操作系统大的需要的更多,导致了磁带数量多,而且磁带本身存在不易保存、安全性差等问题,关键有的时候可能无法恢复。

如何解决目前操作系统存在的问题呢,我们对操作系统集中备份恢复的技术进行了研究,下面以IBM的操作系统为例进行说明和测试。

二、CSM(Cluster Systems Management)软件

(一)CSM软件介绍

CSM是AIX自身的软件包,客户端/服务器模式,客户端(Managed Node)安装csm.client软件包,服务器(Management Server)安装csm.server软件包。可以通过Management Server单点控制所有节点,包括IBM p5,power4,power3机型运行AIX5L的节点。CSM和AIX紧密结合,系统开销很小,和其它第三方的管理软件比,更安全稳定。AIX5L缺省安装中已经包含 csm.client 软件包,要使用CSM功能,需购买CSM软件许可证,配置CSM服务器,然后通过CSM服务器单点控制所有节点,实现各种功能。CSM服务器的宕机对所管理的节点不会造成任何影响。通过单一控制台控制进行硬件控制,通过CSM服务器进行硬件开关机操作查看节点开关机过程中LED的代码显示。

(二)CSM软件功能

系统安装:配置好CSM服务器后,在4小时内可以完成可以50台节点的安装所有节点配置参数相同,便于管理增加新机器时,不仅安装迅速,而且不用担心配置和原来机器有所不同。

系统管理:CSM提供的dsh功能可以在所有机器上执行同一条命令并可对返回结果格式化,方便高效通过单点维护各节点补丁版本,配置参数CSM提供CFM(Cluster File Manger)功能,能够保证用户所需要的文件在所有节点上的一致。用此功能可以实现统一的用户管理。

系统备份:将各节点的操作系统备份保存到CSM服务器上,恢复时通过网络安装,安全快速高效。

系统监控:结合AIX的RSCT组件的功能,CSM能够实现通过单点监控所有节点的运行状况,并可定义动作对错误自动进行纠正

其中一个非常实用的就是通过网络来完成操作系统的备份和恢复。只要是主机和HMC控制台网络可达都可以实现。

在使用了这个软件之后,可以分担备份系统的工作,实现系统管理方面的技术更新,减轻管理员的日常工作量,建立集中的,统一的,标准的现代化系统备份管理方式,提高安装大量新系统的效率。

三、CSM集中备份

(一)CSM集中备份介绍

CSM通过网络提供AIX软件的安装,升级,恢复等管理服务,CSM提供一种简单高效的软件安装和维护方式。

举例:当有两个以上的IBM P系列主机时,我们可以找到一种安装和升级AIX系统而且不需要光驱和磁带机的方式,我们需要一种对AIX系统远程管理的方式(不用到达机房,在办公室或家中就可以实现),我们需要一种标准模式来维护多个AIX版本的主机。

(二)CSM集中备份功能

统一备份client的rootvg

恢复client的rootvg

维护client(升级系统补丁,硬件诊断)

定制SOE后快速安装新系统

系统迁移(rootvg从旧机器迁移到新机器)

(三)CSM集中备份的优势

实现真正意义上的远程管理系统,系统安装,升级,备份和恢复等操作,无须到达现场。

并发性好:同时给多个系统做安装,升级和备份。

管理范围广:同时管理AIX5.1,AIX5.2,AIX5.3,AIX6.1及各个小版本的客户端

灾难恢复:CSM服务器可以在最短的时间内恢复多个操作系统(无须光盘和磁带)。

定制rootvg后,方便多系统的安装和管理。

恢复mksysb速度快(平均比磁带速度快15-30分钟)。

使用简单,方便。

支持openSSL(更加安全的网络通讯)。

可以实现系统定时自动备份,减轻管理员的工作量。

(四)CSM集中备份环境

一个基本的CSM集中备份环境包含TCP/IP网络和多个p系列小型机。

TCP/IP网络可能会横跨多个网段,在多个网段中可以建立一个或多个CSM集中备份环境。

CSM集中备份环境中至少要有一个服务器和一个客户端。

CSM集中备份的术语:

Master:建立和维护CSM集中备份环境的主机

Client:CSM服务器进行操作的主机,比如:安装,升级等

Resource server:拥有某种软件资源的主机,一般把CSM master当作resource server

(五)CSM集中备份的工作流程

为了保证CSM集中备份能够正常使用,有两个资源是必须的:LPP resource和SPOT(Shared Product Object Tree),SPOT:是存放系统引导启动的文件,它的作用是引导客户端启动,如果SPOT比mksysb的版本低,则不能正常恢复系统

LPP_source:与AIX的安装光盘相似,包含AIX的安装文件。

四、集中备份系统的测试

我们利用测试机器,安装了CSM的服务器软件和客户端软件进行了测试,取得了很好的效果:

1.操作系统的备份仅需要3分钟的时间,恢复也只用了10分钟。相对于磁带的备份恢复过程要简短得多。

2.备份和恢复的操作都是通过网络传输的,由于是经过压缩,数据量很小,不会对网络的流量造成较大影响。

3.所有的操作都可以定时自动完成,不需要人为的干预,大大减少了维护人员的工作量。

4.备份的数据是存放在硬盘上的,相比磁带来说数据的安全性是有了很大的提高。

上一篇:试论项目化管理在降本增效工作中的实践 下一篇:基于Web的档案管理系统研究