刀片之争――四款刀片服务器测评

时间:2022-06-12 07:31:23

刀片之争――四款刀片服务器测评

今年3月,英特尔32纳米的至强处理器5600系列正式推出,它主要用于双路服务器和工作站系统,可带来更加出色的计算性能及能效。美国《InfoWorld》近期对基于该处理器的戴尔PowerEdge M1000e、惠普BladeSystem c7000和IBM BladeCenter H等数款刀片服务器系统进行了测试。

英特尔至强处理器5600系列(研发代号为Westmere-EP)是英特尔新一代智能服务器处理器,与上一年英特尔推出的至强5500系列相比,在技术上有了很大进步。它采用更为先进的32纳米制程工艺,成为英特尔服务器和工作站处理器中首批采用该工艺且最多集成了六个内核的芯片产品。另外,它采用英特尔第二代高K金属栅极晶体管技术,实现了处理器计算速度的提升和能耗降低,使至强5600 系列在性能上比基于45纳米的至强5500系列提升最高达60%。基于这一性能表现,数据中心用户完全可以用1台基于至强5600系列的服务器来替换15台基于单核处理器的旧服务器,并最短在5个月内收回新服务器的采购成本。

在英特尔官方至强5600(Westmere)处理器之前,戴尔、惠普和IBM采用这款最新处理器的刀片服务器送到了《Infoworld》在夏威夷大学的测评中心。之后进行的基准测试表明,Westmere把刀片推向了新的高度。我们在测评中还添加了经济型的Supermicro刀片机箱。带4块刀片的戴尔、惠普或IBM机箱起价都超过4万美元,而Supermicro解决方案的成本只是它们的零头,虽然它与这三大刀片系统不是一个级别的,但对可能不需要最新功能或最高性能的公司来说却是个值得关注的选择。因此,我们也对它进行了同样的测试。所有测试工作都在夏威夷大学的高级网络计算实验室(ANCL)进行。

测试介绍

这次测试我们没有使用HPC基准测试,而是选择了一套定制的VMware测试和一系列实际性能指标的测试。VMware测试由以下这几部分组成:一个大规模的定制LAMP应用软件(运行Nginx的负载均衡器)、四台Apache Web服务器和两台MySQL服务器,它们都配备了充足的虚拟处理器(vCPU)和内存资源,以便每块刀片中的物理和逻辑处理器可超额订购(oversubscribe)。

工作负载旨在模仿实际的Web应用使用模型,对静态/动态内容、随机化的数据库更新、插入和删除进行加权组合处理。这个负载按特定的并发数量来生成,开始是50个并发连接,然后增加到200个。所有刀片最适合处理的并发连接数量是150个,于是我们用这个数字作为公布结果。先在一块刀片上进行这些VMware测试,随后在两块刀片上进行。刀片运行的是VMware ESX4,由专用vCenter实例来控制。

其他实际测试是一批同时运行的常见单线程任务,任务数量达到及超过每块刀片上的逻辑处理器数量,一直增加到物理核心的8倍超额订购。这些测试包括对155MB的WAV文件进行LAME MP3转换、对155MB视频文件进行MP4到FLV视频的转换、gzip和bzip2压缩测试以及MD5求和测试――之前我们用同一套基准测试来比较新的英特尔Westmere-EP和前一代的Nehalem-EP处理器。它们充分代表了实际的工作负载,并证明能始终如一地反映总体刀片性能。

除了这些测试外,我们的最后一项基准测试是使用Ixia的IxChariot工具,评估同一机箱中刀片之间的网络吞吐量。这些测试基于几个常用负载,包括iSCSI 32K和256K读取测试、流量仿真负载以及评估连接速率的BitTorrent P2P负载。我们还使用Ixia的IxLoad测试工具对LAMP应用软件生成负载,以便进行初步性测试,之后使用基准测试套件的内置客户端来进行。

Westmere间的比拼

虽然戴尔、惠普和IBM可以为这次测评随意选择自己喜欢的处理器,但它们送测的系统中每块刀片都采用英特尔Westmere-EP X5670 2.93GHz处理器和至少24GB的内存。选用Westmere的理由很明显:六核比四核快,加上Westmere每个核心的性能也比Nehalem略胜一筹,因此,它们是眼下64位领域速度最快的处理器。

戴尔还带来了一组X5680 3.33GHz处理器,我们可以看到X5680处理器有怎样的表现。不过为了进行同类比较,我们评估了基于X5670芯片的戴尔刀片具有的性能。低成本的Supermicro刀片配备了速度较慢、但价格便宜得多的AMD皓龙2378,这是时钟频率为2.4GHz的四核Shanghai处理器。

我们还允许每家厂商自己选择配置的存储类型。戴尔带来了戴尔EqualLogic PS6010XV万兆iSCSI存储区域网络(SAN)阵列,惠普的是EVA 2124光纤通道阵列,IBM配置了System Storage DS5020,走的也是光纤通道路线。由于时间较紧,加上存储介质之间相对有差异,没有进行SAN阵列吞吐量测试。

刀片性能测试结果很有意思,因为基本上都一样。戴尔、惠普和IBM的刀片解决方案都采用了Westmere X5670,彼此在所有测试方面的表现都在误差范围内。

线程并发测试结果表明,大体上来说,戴尔、惠普和IBM的刀片不相上下,IBM以微弱优势排在首位。VMware LAMP 应用软件测试的结果也几乎打成平局,IBM、惠普和戴尔每秒可处理的请求分别是2125次、2110次和2104次,IBM仅以0.7%的优势领先。总之,这三个配备Westmere的刀片系统在测试中性能方面的差异并不大。

低成本的Supermicro排在末位,这不出所料。由于它的每个处理器都使用四核而不是六核,时钟速率较低,又只有8GB内存,再加上芯片要落后好几代,Supermicro就其成本而言,其表现实属不错,但与英特尔Westmere刀片根本没法比,这不足为奇。

由于戴尔还带来了一组3.33GHz英特尔Westmere X5680处理器,于是我们换成这款处理器安装到其中一块戴尔刀片上,重新进行线程并发测试。结果比基于X5670的测试快12%左右,这反映了每个核心的时钟频率快400MHz的事实。

有意思的是,戴尔、惠普和IBM刀片在Ixia IxChariot吞吐量测试中的表现同样出色。这表明,现在各大厂商基本上统一使用了英特尔Westmere,而内部万兆交换架构业已成熟。Supermicro送测刀片没有万兆,但测试刀片上的千兆接口其性能还是符合要求的。

测评总结

在测试最后一天,我们把超过1吨重的刀片服务器硬件运回了它们各自所在的公司。深入了解这些现代刀片服务器的工作机理足足花了几个星期的时间,我们得出了一些基本数据。

在同类比较的基础上进行测评,戴尔、惠普和IBM的刀片系统都能达到性能指标。这些厂商提供的配置相似的刀片系统在刀片性能上差异不大。因而,由于性能方面没有太大差异,我们对这组刀片的评估就转移到了功能、选项、价格和管理工具上。完整的具体测评内容见后面的报告,这里简要介绍一下测评结果。

自上一次测评以来,戴尔无疑一直在精简刀片管理界面,该公司推出了一些极有吸引力的功能,比如全局BIOS和固件更新工具。惠普的管理功能也很全面,但缺少其他厂商提供的几项功能,比如更新BIOS和固件以及映射本地共享资源以便挂载虚拟驱动器和ISO映像的功能,这让人难以理解。IBM也不马虎,使用了简洁、易于浏览的管理图形用户界面(GUI)。当然,这三家厂商还都提供了外部全局管理工具,把刀片和服务器的管理提升到了新的水平,但这些工具不在这次测评范围之内。

如何选择?

如果是一般的应用,你用这些解决方案中的任何一款都能顺利完成工作。如果你想要一款性能稳定、价格偏低的刀片服务器平台,又不需要存储刀片等额外特性,那么,戴尔M1000e很适合你。如果你需要内部存储,比如用于分支办事处部署,或者需要广泛的刀片类型,那么惠普c7000会合你的心意。如果你不介意每个机箱少两个刀片插槽,但需要一些额外的冗余性能,那么IBM BladeCenter H可能正是你所需要的。如果你担心开支问题,又不介意加大工作量、牺牲一些性能和选项,那么Supermicro SuperBlade不失为一种极其划算的办法,可以为你的数据中心添加刀片。

不过你选择哪个,有一点很显然:目前这批刀片服务器已完全准备好了顺应虚拟化潮流、可以应对几乎任何挑战。如果你选择了其中一款刀片系统,而不是选择普通的1U服务器,不但有望获得出色的性能,还有望获得更高的可用性和全面管理,以及更低的电源和冷却成本。其中一些解决方案中的高级电源和冷却管理同样有助于节约总体成本。

上一篇:国内首个全程电子商务平台 下一篇:企业安全新“木桶”