全球同步测试英特尔Nehalem处理器平台

时间:2022-08-26 05:56:50

全球同步测试英特尔Nehalem处理器平台

作为媒体测试工程师,已经经历了无数次抢先测试了。在产品上市前,和厂商在产品技术上就能进行探讨,更有抢先拿到测试样机的机会。而像英特尔这次Nehalem的机会则不多见,其全球同步的时间是2009年3月30日星期一(美国时间),而我们的文章是要在3月31日就发表出来。我们提前一周进行了紧张的测试,将第一手新鲜热辣的结果在这里和广大读者进行一下交流。

我们拿到的测试样机是英特尔直接从美国提供的一台1U机架式服务器。箱子不大,重量也不沉,这也许就是Nehalem服务器的一个重要特点吧,毕竟少了北桥的主板,布局和设计会更容易些。

样机是华硕的R12A服务器,它安装了两颗X5570处理器,主频2.93GHz,搭配6条Micron 4GB DDR3 1333内存。两块Seagate ST3320613AS SATA硬盘,直接连接主板上的ICH10提供的SATA口。板载英特尔82574L版的千兆以太网网卡,提供两个千兆接口。最令人纳闷的是板载显卡是Aspeed公司的AST2050。机架式服务器基本上都提供冗余电源,送测服务器安装了一块Delta DPS-770AB电源模块。

Xeon 5500和

Xeon 5400

英特尔公布的Nehalem其实是Xeon 5500的代号,正式在市场销售的时候,会冠以Xeon 5500系列的名称,它与Xeon5400同样基于45nm工艺制造,所不同的是作为英特尔Tick-Tock钟摆战略中的Tock,Xeon 5500微体系架构的计算核心与前代Xeon 5400相同,主要变化集中在核边架构上。

在英特尔之前的处理器中,除了计算核心外,剩下的就是Cache和少量其他电路,而Xeon 5500除了计算核心和Cache外,还将原本属于北桥的内存控制器集成到处理器内部,原本处理器和外界交换数据的FSB被QPI通道取代,内存则直接由处理器集成的三条DDR 3内存通道来控制。

两者虽然基于同样的技术核心,但是在周围电路和指标上差异还是非常大的。两者接口不同,Xeon 5500集成内存控制器后提供了3条内存通道,因此在接口上比Xeon5400多了许多,接口是LGA1366;两者的Cache类型和大小不同,Xeon 5500有三级Cache,L3 Cache容量8MB,由四个计算核心共用,而Xeon 5400只有两级Cache,L2 Cache容量6+6MB;也正是因为Cache容量有了变化,因此在物理上,Xeon 5500的晶体管数目达到7.31亿个。由于集成了内存控制器等电路,Die的面积达到了246mm2,相比Xeon 5400的8.2亿个晶体管和214mm2的Die尺寸,区别还是很明显的。

虽然在主板上看不到传统的北桥芯片,但是在安装操作系统的时候,芯片组驱动还是需要的,在Windows Server 2008下,安装芯片组驱动和网卡驱动后,服务器的测试平台就准备好了,这比起早些时候的服务器测试而言,简单了许多,而且因为I/O带宽大幅度提升,连操作系统的安装速度都快了很多,以往需要半天的安装过程,在十几分钟内就能完成。

测试结果分析

基于应用的测试是计算机世界实验室的传统服务器测试方案,对于Xeon 5500也不例外,测试设备是计算机世界实验室技术合作伙伴思博伦通信提供的Avalanche 2500 & Reflector 2500,它将从模拟实际用户的角度出发来考察在作为Web应用的服务器时能有何种表现。

既然Xeon 5500和Xeon 5400的计算核心一样,架构不同,那么我们的对比测试就在它们之间展开。新平台使用的处理器是Xeon 5570,2.93GHz,旧平台使用的是Xeon 5472,3.0GHz,两者间频率差异几乎可以忽略不计。

在测试前,单从架构上分析就可以知道,基于I/O吞吐的性能测试将会有巨大的提升,毕竟原来SMP结构的双路服务器受前端总线带宽的限制还是很明显的;而纯粹的计算性能两者应该相差无几,毕竟计算核心是同一代的设计,连工艺也都同为45nm级。

在强调I/O吞吐能力的ASP测试中, 45000per性能几乎是上一代产品的3倍,同样也达到了45000per,I/O带宽的提升显然带来了性能的巨大飞跃。而在计算强度更强的SSL类测试中,计算密集型的SHA256算法性能提升18%,而计算强度较弱的MD5性能提升了76%。很显然,这代Xeon 5500平台的服务器在I/O能力上远超上一代产品。

新特性的探讨

Turbo和SMT技术都是在服务器平台上新出现的。Turbo技术是在保证处理器TDP(处理器整体功耗)不超标的情况下,针对某些计算核心进行最高达30%的超频运算,在确保服务器运行正常的情况下提升非多线程应用的性能; 而SMT说白了是增强型的HT(超线程)技术,虽然在P4时代HT并不怎么显眼(除了操作系统中多认出一颗处理器外没有太多性能上的变化),但是在Xeon 5500上的增强版HT,性能的提升还是非常明显的,这应该和I/O带宽大幅度增加有密切的关系。

从测试软件black_scholes的测试结果来看,Turbo和SMT都能提升计算速度,不过在Xeon 5570的高I/O下,即便关闭了这两项设置,Xeon 5472也要甘拜下风。

不过计算更密集的SunGard 4.0就不同了,关闭这两项设置后,Xeon 5570就要慢于Xeon 5472了,但是打开任何一项都会超过Xeon 5472; 全打开后性能提升22%,对于相同计算核心的两款处理器而言,如此大差异显然是和I/O优势密不可分的。

从测试结果来看,SMT带来的优势显然比Turbo大,而在P4时代,HT并不能带来特别的性能提升,显然SMT也得益于QPI互联带来的高带宽,才有机会发挥增强型HT的优势。

功耗测试

能将服务器的静态功耗降到164W,应该是处理器深度节电技术带来的特性,Xeon 5500的计算核心虽然同Xeon 5400相同,但是每一个计算核心都设置了独立的供电电路,可以更准确和精细地控制处理器计算核心的功耗,而整合的8MB L3 Cache也提供休眠节电的特性,因此在静态功耗上能取得非常好的成绩。在全速工作中,服务器峰值功耗310W,具体到每一组处理器和内存的整体功耗只有73W,DDR3内存显然比上一代的FB-DDR2要省不少电。

受时间的限制,我们有太多的测试还没有做,但是从这些已取得的测试结果来看,Nehalem平台的未来不可小觑: 低功耗特性,高性能表现,就像古语所说―静如处子,动若脱兔。

上一篇:IDC:联想网御逆市增长 下一篇:BLADE万兆交换机应用于HPC