时间:2022-07-18 10:03:25
摘要:本文对操作系统的备份恢复现状中遇到的问题进行了分析,对相关软件的功能、优势、备份所需要的环境、备份的模式、实施流程进行了介绍。
关键词:操作系统备份;CSM
中图分类号:TP309.3 文献标识码:A 文章编号:1674-7712 (2012) 10-0103-01
一、操作系统备份恢复现状
在日常维护过程中,根据内控的要求,对于主机的操作系统要三个月备份一次,除此之外在操作系统发生重大变化的前后都要进行备份,整个信息支撑系统的需要备份的主机多在达200多台,而且还在不断地增加,利用现在传统的磁带备份模式,重复的工作量是非常巨大的。而且磁带的备份模式本身就存在很大的不稳定性,能否可恢复都是不可预知的。其中以IBM的设备为例,涉及到的系统多,机型多,包含P4、P5、P6等,有的有内置磁带机,有的没有。这么多的主机,为保险起见,每台至少需要两盘小磁带做备份,操作系统大的需要的更多,导致了磁带数量多,而且磁带本身存在不易保存、安全性差等问题,关键有的时候可能无法恢复。
如何解决目前操作系统存在的问题呢,我们对操作系统集中备份恢复的技术进行了研究,下面以IBM的操作系统为例进行说明和测试。
二、CSM(Cluster Systems Management)软件
(一)CSM软件介绍
CSM是AIX自身的软件包,客户端/服务器模式,客户端(Managed Node)安装csm.client软件包,服务器(Management Server)安装csm.server软件包。可以通过Management Server单点控制所有节点,包括IBM p5,power4,power3机型运行AIX5L的节点。CSM和AIX紧密结合,系统开销很小,和其它第三方的管理软件比,更安全稳定。AIX5L缺省安装中已经包含 csm.client 软件包,要使用CSM功能,需购买CSM软件许可证,配置CSM服务器,然后通过CSM服务器单点控制所有节点,实现各种功能。CSM服务器的宕机对所管理的节点不会造成任何影响。通过单一控制台控制进行硬件控制,通过CSM服务器进行硬件开关机操作查看节点开关机过程中LED的代码显示。
(二)CSM软件功能
系统安装:配置好CSM服务器后,在4小时内可以完成可以50台节点的安装所有节点配置参数相同,便于管理增加新机器时,不仅安装迅速,而且不用担心配置和原来机器有所不同。
系统管理:CSM提供的dsh功能可以在所有机器上执行同一条命令并可对返回结果格式化,方便高效通过单点维护各节点补丁版本,配置参数CSM提供CFM(Cluster File Manger)功能,能够保证用户所需要的文件在所有节点上的一致。用此功能可以实现统一的用户管理。
系统备份:将各节点的操作系统备份保存到CSM服务器上,恢复时通过网络安装,安全快速高效。
系统监控:结合AIX的RSCT组件的功能,CSM能够实现通过单点监控所有节点的运行状况,并可定义动作对错误自动进行纠正
其中一个非常实用的就是通过网络来完成操作系统的备份和恢复。只要是主机和HMC控制台网络可达都可以实现。
在使用了这个软件之后,可以分担备份系统的工作,实现系统管理方面的技术更新,减轻管理员的日常工作量,建立集中的,统一的,标准的现代化系统备份管理方式,提高安装大量新系统的效率。
三、CSM集中备份
(一)CSM集中备份介绍
CSM通过网络提供AIX软件的安装,升级,恢复等管理服务,CSM提供一种简单高效的软件安装和维护方式。
举例:当有两个以上的IBM P系列主机时,我们可以找到一种安装和升级AIX系统而且不需要光驱和磁带机的方式,我们需要一种对AIX系统远程管理的方式(不用到达机房,在办公室或家中就可以实现),我们需要一种标准模式来维护多个AIX版本的主机。
(二)CSM集中备份功能
统一备份client的rootvg
恢复client的rootvg
维护client(升级系统补丁,硬件诊断)
定制SOE后快速安装新系统
系统迁移(rootvg从旧机器迁移到新机器)
(三)CSM集中备份的优势
实现真正意义上的远程管理系统,系统安装,升级,备份和恢复等操作,无须到达现场。
并发性好:同时给多个系统做安装,升级和备份。
管理范围广:同时管理AIX5.1,AIX5.2,AIX5.3,AIX6.1及各个小版本的客户端
灾难恢复:CSM服务器可以在最短的时间内恢复多个操作系统(无须光盘和磁带)。
定制rootvg后,方便多系统的安装和管理。
恢复mksysb速度快(平均比磁带速度快15-30分钟)。
使用简单,方便。
支持openSSL(更加安全的网络通讯)。
可以实现系统定时自动备份,减轻管理员的工作量。
(四)CSM集中备份环境
一个基本的CSM集中备份环境包含TCP/IP网络和多个p系列小型机。
TCP/IP网络可能会横跨多个网段,在多个网段中可以建立一个或多个CSM集中备份环境。
CSM集中备份环境中至少要有一个服务器和一个客户端。
CSM集中备份的术语:
Master:建立和维护CSM集中备份环境的主机
Client:CSM服务器进行操作的主机,比如:安装,升级等
Resource server:拥有某种软件资源的主机,一般把CSM master当作resource server
(五)CSM集中备份的工作流程
为了保证CSM集中备份能够正常使用,有两个资源是必须的:LPP resource和SPOT(Shared Product Object Tree),SPOT:是存放系统引导启动的文件,它的作用是引导客户端启动,如果SPOT比mksysb的版本低,则不能正常恢复系统
LPP_source:与AIX的安装光盘相似,包含AIX的安装文件。
四、集中备份系统的测试
我们利用测试机器,安装了CSM的服务器软件和客户端软件进行了测试,取得了很好的效果:
1.操作系统的备份仅需要3分钟的时间,恢复也只用了10分钟。相对于磁带的备份恢复过程要简短得多。
2.备份和恢复的操作都是通过网络传输的,由于是经过压缩,数据量很小,不会对网络的流量造成较大影响。
3.所有的操作都可以定时自动完成,不需要人为的干预,大大减少了维护人员的工作量。
4.备份的数据是存放在硬盘上的,相比磁带来说数据的安全性是有了很大的提高。