对虚拟机故障恢复技术的研究

时间:2022-07-10 10:16:26

对虚拟机故障恢复技术的研究

摘要:在这个信息化社会,无论是高校还是企业,对服务器的工作效率和可靠性的要求都越来越高,虚拟机就能够达到这个要求,因此这种技术随之越来越受追捧。在现实应用中,为了实现每个操作系统相互独立,不互相影响,实际情况又没有那么多实体机,应用虚拟机就可以达到这个目的。应用虚拟技术,使得每个操作系统相互独立,充分提高系统资源的利用率。但值得注意的是,VMware使用率提高了,它本身出现故障,如何恢复故障也是我们值得研究的。因此,提高VMware的可靠性是我们研究的主要问题。研究虚拟机故障恢复技术,当实体机发生故障时,如何快速进行故障恢复,服务器能够进入正常工作,从而减少故障对实体机造成的影响。

关键词:故障恢复;虚拟化;迁移;备份

1.1 故障恢复技术

研究故障恢复技术的目的是为了提高系统的安全性。在容错系统中,一旦检测到发生故障,通过故障恢复技术对故障可以进行恢复,以一定的代价将系统从故障状态恢复至正常运行状态,减少故障对系统造成的损害。提高系统的利用率主要有两种有方法:第一是增加系统平均无故障的时间那么就要防止系统发生故障;第二是在短时间内恢复故障,从而降低减少故障恢复的时间。一个性能再高的系统都不可能不出现故障,出现故障如果能够尽快地故障恢复,从而提高系统的利用率,能够以最小的代价故障恢复,使系统恢尽快处于正常工作状态。

冗余为基础是容错技术实现的基础,硬件和软件冗余是冗余的两大分类。对数据、时间、空间冗余会对系统的性能造成相应的影响。因此,这些冗余方法是系统需要付出代价的,但故障恢复技术,还要需要这种技术具有透明性,灵活性,适用性等。为了使应用系统察觉不到故障恢复技术,因为系统运行容错功能与应用系统是相互隔离的,互不干扰,这体现的这种技术的透明性。由于系统中的信息在随时发生变化,应用程序的多样性,对不同状况进行灵活的处理,容错技术的灵活性能够达到这个要求。由于故障的种类的具有多样性,那么要求故障恢复技术可对多种故障的系统能够进行恢复操作,这就是故障恢复技术的多样性特点。

1.2 检查点技术

checkpoint技术即检查点技术,保存系统在某一正常运行时的重要状态信息在检查点文件中[1],如果系统运行出现故障时,检查点技术可以读取之前保存的文件,利用检查点保存的数据,使得系统能够恢复到该检查点文件设立时的正常运行状态下,那么系统便会在这种状态下继续正常运行。

1.3 恢复块技术

恢复块技术是一种常用于软件故障的恢复技术。某些程序故障会引起硬件故障和临时故障,因此这种恢复技术可以恢复某些硬件故障和临时故障。恢复块技术是由检查点、替换算法和算法结果三部分组成的。执行恢复块算法的原理是:在程序设置检查点是要选择某一时间点,程序并在相应的算法下执行,程序执行完一次后,由检测模块对程序结果进行检测,如果程序结果通过测试就可以说明程序正常运行,随之就会将正确的运行结果提交上去;若程序在执行原算法时发生错误,那么这种恢复技术就会将程序恢复到之前设置的检查点,从替换算法中选择合适的算法,使用新的算法程序再从新执行一遍,运行结束后再次调用算法看是否能够通过检测,如果运行结果还是没有通过检测,那么就会一直执行算法的替换,所有的替换算法都执行了,如果得到正确结果,恢复块算法结束;若所有替换算法都执行了,仍然没有得到正确结果,错误信息就会向系统回馈。

1.4 备份技术

备份技术是一种冗余技术。冷备份与热备份是备份技术的两种类型。冷备份技术,要对系统进行备份需要选择合适的时间,如果系统突然发生故障,造成系统的运行状态的中断和数据丢失,将导致系统无法正常运行。要注意的是冷备份时,要使系统停止运行,采用某种策略将系统数据进行保存备份,保存系统数据将用于恢复出现故障的系统。由此可见,这种备份方法是有缺点的,备份的时候需要系统长时间停机,所有应用程序随之停止运行,那么系统的连续性就没法得到保障。热备技术是用来提供快速系统恢复,提高系统可用性的冗余技术。如果服务器上运行着重要的不间断的服务,并且需要随时备份服务器的运行状态,热备份能够对随时发生的故障进行快速恢复处理。在进行热备时,热备的服务器是处于正常运行的,相应应用程序正常运行,通过某种方式将数据传输到拥有完全相同配置的服务器上,传输的内容有:处理器个寄存器的信息,内存和网络、磁盘的数据等等,对两台服务器进行同步检测,使得两台服务器始终处于一致状态。如果本服务器由于故障导致无法正常运行,那么备份服务器就会启用起来,正常运行原来服务器上的服务,使得服务器上的服务能够不间断的运行。

由于同步方式的不同,热备份可以分类为两种:定时和事件触发。原服务器和备份服务器在每规定的时间内进行运行状态的同步这种方式就叫做定时同步;只有当某个条件到达时原服务器和备份服务器才会进行同步,这种方式叫做事件触发同步。事件触发和定时同步方式相比它们各有自己的优缺点,同步方式的热备份在精准上比事件触发同步更好,但事件触发同步的性能就比同步方式更好。在热备中,按照两台服务器的工作状态进行分类可以分为:主从,双机互备与并行三种模式。正常运行的服务器作为主服务器(primary 服务器),处于监听状态,不断与 primary 服务器进行同步,但自身服务并不运行,并且处于挂起状态的服务器作为从服务器(backup 服务器),这种模式叫主从模式。backup服务器从挂起状态到运行状态的条件是primary 服务器发生故障,从服务器就会运行原来主服务器上的应用服务。两台服务器都为主服务器,都为系统提供服务并且不间断的进行同步,检测对方的运行状态这种方式称之为双机互备模式。并行模式,是要对服务进行负载均衡的处理,并在各自的的服务器上运行。如果其中一台服务器发生故障另外一台服务器将运行属于故障服务器的服务。(作者单位:西华师范大学网络中心)

上一篇:以“猫儿”为例,探究“儿化”中的“儿”做语素... 下一篇:初中英语学习兴趣调查研究