论VMware高可用群集的优势

时间:2022-09-03 01:44:09

[摘 要]使用VMware搭建高可用性集群,有效地解决了用户对网络必须可靠、高速、稳定地运行的要求,很大程度上方便了网络管理员的日常管理工作。

[关键词]大数据 服务器故障 ; 双机热备; VMware高可用群集

中图分类号:TP391 文献标识码:A 文章编号:1009-914X(2015)33-0002-01

随着大数据时代的到来,面对庞大的计算机网络,用户要求网络必须可靠、高速、稳定地运行。当前绝大多数网络服务采取的是中心服务器的模式,服务器的高可靠性、高可用性是网络安全运行的关键。一旦服务器出现故障,所提供的服务就会被中断,从而造成严重后果。如何在故障情况下尽快恢复使用并保证数据的安全,已经成为一个日渐突出的问题。

传统的解决方案是服务器双机热备份技术。所谓双机热备份,简单来说,就是用网络将两台服务器连接起来,平时互相备份,共同执行同一服务。当一台服务器停机时,可以由双机中的另一台服务器自动将停机服务器的业务管理,从而在不需要人工干预的情况下,保证系统能持续提供服务。

然而双机热备系统,需要专用的共享存储、专门的管理软件,无论是前期的安装配置,还是后期的管理应用,都比较复杂,需要专业人员进行维护。另外双机热备系统对硬件的要求较高,硬件投入较大。另外,传统的双机热备系统,通常两台服务器与一套共享的存储,只能运行一个应用,不能对多个应用同时进行热备,这样就造成了较大的浪费。但双机热备也有优点,就是热备系统中故障的切换时间非常短,当热备中的一个主机出现问题时,另一个主机会马上接管工作,基本上不影响业务系统。另外,双机热备也能充分发挥、利用服务器的资源(资源利用率约为50%)。

为了更好的解决服务器中断问题,VMware研发了高可用群集。VMware高可用群集是构建在VMware ESXI Server、vCenter Server之上的一套系统,VMware的高可用性,则是针对运行于VMware ESXI之上的虚拟机进行的。基于此,VMware的高可用群集,是可以支持任何甚至X86的系统,无论是Windows还是Linux,无论是Oracle还是SQL Server,只要安装配置好虚拟机,并在虚拟机中以正常的方式安装应用软件,都可以配置为群集。

VMware的高可用群集中的虚拟机在不同的主机运行,可以从一个主机迁移到另一个主机。虚拟机保存在共享的储存时,使用vMotion功能,可以快速地将一台正在运行的主机,迁移到另一主机。对于重要的虚拟机,要监控其运行状况,当主机出问题时,立刻在另一主机启动该虚拟机的副本并且保证数据的一致性。

针对用户所要求的级别不同, VMware的高可用群集中,设计了两种功能称为“HA-高可用群集”与“FT-容错”。群集与容错的区别如下:

1、群集与容错都能检测到系统的故障,是为了实现系统的高可用性来设计的。但群集中的虚拟机,同一时间只能在A或B上运行,并且在出现故障时在其他主机上启动,这有一个系统重新启动的时间,大约几十秒到几分钟的时间。

2、而容错功能,容错中的虚拟机是在另一个主机上,启动一个副本虚拟机,主虚拟机与副本虚拟机同时启动,并且是在不同的主机启动,主机的操作系统会反映到副本中,两个主机执行相同的运作与行为。在工作时,副本虚拟机是只读的,不能修改。当主虚拟机出现问题时,副本虚拟机会被设置为主要,并且对外提供服务。当原来的主虚拟机恢复后,原来的主虚拟机会被成为新的副本虚拟机。

与传统双机热备份不同在于,由于虚拟机所在的虚拟磁盘是保存于共享的存储上,而虚拟机本身是运行于群集中某个ESXI主机上,当运行虚拟机的主机由于各种问题(网络、电源或主机硬件问题)导致虚拟机不能运行时。这样会有一个中断的时间。

VMware HA 群集允许ESXi 主机集合作为一个组协同工作,这些主机为虚拟机提供的可用性级别比ESXi 主机单独提供的级别要高。VMware HA 可以将虚拟机及其所驻留的主机集中在群集内,从而为虚拟机提供高可用性。群集中的主机均会受到监控,如果发生故障,故障主机上的虚拟机将在备用主机上重新启动。

如果主机发生故障,VMware HA不会将任何虚拟机故障切换到处于维护模式的主机,因为VMware HA计算当前故障切换级别时不会考虑此类主机。主机退出维护模式后,会重新启动该主机上的VMware HA服务,因此该主机可再次用于故障切换。

如果在15秒过更长时间内隔离主机的网络连接仍未恢复,则群集内的其他主机将认为该主机发生了故障,并会尝试故障切换其虚拟机。但是,如果隔离主机保留对共享存储器的访问权限,则它也会保留虚拟机文件上的磁盘锁。为避免潜在数据损坏,VMFS磁盘锁定会阻止对虚拟机磁盘文件同时进行写操作,并尝试故障切换隔离主机的虚拟机故障。默认情况下,隔离主机会保持其虚拟机为启动状态,但您可以更改主机对"虚拟机关机"或"关闭虚拟机"的隔离响应。

VMware HA在ESXi主机群集的环境中运行。必须创建一个群集,然后用主机填充该群集,并在建立故障切换保护之前配置VMware HA设置。如果要配置VMware 群集或容错,用于管理群集主机的VMware vCenter Server,应该是一台物理主机,或者是运行于受管理的VMware ESXi主机之后的其他主机上的虚拟机,其体系结构如图1所示。在大多数的企业中,只配置两台VMware ESXi ,这只能满足群集的最低需要。如果要让群集完美地工作,应该在群集中配置至少3台主机。

如果vCenter Server是其管理的群集中的某台虚拟机,当运行vCenter Server的主机出现故障时,则整个群集将不可管理,这样群集将不能发挥作用,达不到设计要求。

创建VMware HA群集时,必须配置许多可决定功能如何运行的设置。在此之前,首先请确保群集的节点。它们是为支持虚拟机而提供资源,而且将由VMware HA用于故障切换保护的ESXi主机。然后应当确定如何互相连接这些节点,以及如何将这些节点连接到虚拟机数据所驻留的共享存储器。在建立好网络构架后,可以将主机添加到群集并完成VMware HA配置。

VMware的容错,是在HA的基础上实现的,可以做到传统双机热备无法完成的“零”切换时间。容错中的虚拟机会有一个“主机”及一个处于“只读”状态的“从机”,无论主机还是从机,都同时运行并且运行在不同的ESXI主机上,并且当其中之一出现故障时,会立即接管,完美的解决了服务器中断问题。

参考文献

[1] 姚军译《VMware vCAT权威指南》 机械工业出版社

[2] 王春海著《VMware 虚拟化与云计算应用案例详解》 中国铁道出版社

[3]何坤源著《构建高可用VMware vSphere5.X虚拟化架构》人民邮电出版社

作者简介

赵军 男(1980年8月出生)广东省佛山市顺德区胡锦超职业技术学校专业教师,本科研究方向: 网络技术。

上一篇:浅谈如何排除220KV变电站继电保护的故障 下一篇:江37区块蒸汽吞吐井间干扰特征研究