谁革了酷睿的命新一代Nehalem架构解析

时间:2022-09-12 09:18:05

2008年,当大家都在期待着45nm处理器普及的时候,已经靠酷睿微架构打拼了两年的Intel再次着手推出新一代处理器架构――nehalem。从Intel的构想来看,Nehalem仅仅是“Tick-Tock”微架构发展战略的一步而已,不过这一步给我们带来的震撼将远远超过当年的产品换代。取消FSB、整合内存控制器、重新引入超线程概念……Nehalem的种种新特性似乎预示着它将彻底革了酷睿的命。

全新架构设计:超越上一代Conroe

如果拿Pentium 4和Conroe来做比较,那么它们之间的差别就像是黑夜与白天般明显。前者采用的NetBurst架构纯粹就是为了追求时钟速度的极限,而Conroe则刚好相反,只追求时钟周期执行效率。它们在架构设计思想方面,也有本质的不同。Pentium 4需要做极大的软件方面优化,才能更进一步提高硬件的物理效能,此后Intel从中吸取了这个教训,不再期望通过编译器和代码优化来提高硬件的性能,官方在重新设计新一代处理器架构的时候,采用了模块化的设计思想。Conroe则是Intel第一颗包含了4路前端的处理器。这颗处理器可以进行解码、重命名,并且在同一个时钟周期可以执行4个内部微指令。不过事实上Conroe的实际处理效能可能达不到这个程度。在Conroe中,Intel推出了宏指令的概念,它可以将2个X86指令“融合”在一起进行解码、执行和退出操作。这2个指令融合之后,就会被视为是一条指令。这项技术在某些情况下会极大的加速指令的处理效能。

在最新的Nehalem架构中近一步添加了更多的指令融合机制,同时也支持目前所有Core 2中的宏指令技术。另外,在Nehalem中还加入了64bit指令的融合机制。在过去仅仅可以融合32bit的指令,现在64bit的指令融合也可以得以实现。在处理64bit代码的时候,我们可以看到明显的性能改善。

两级预测:分支预测得到改进

除了上述提到的改善外,在Nehalem中分支预测单元方面也得到改进,而且这对于Intel本已经十分强大的分支预测来说,这些改进可算是相当难得了。如今的Nehalem已经有了第二级分支预测单元,虽然它的速度相对较慢一些,不过它能检索到更大的程序分支历史记录,无论他们是否已经被踢出。在L2高速缓存中的分支预测单元具备非常大的代码容积。Intel采用数据库应用软件做了一些实际的演示范例。得益于分支预测的精确性,应用程序的处理效能有显著的增加。

重新回归:Hyper Threading超线程

记得Intel一位高级工程师曾经说过,在微处理器行业中最让他感到兴奋的技术便是超线程。不过在Pentium 4处理器上,我们并没有体验到Hyper Threading超线程的强大,总被DIY发烧友抨击为骗人的玩意。不过在这次的Nehalem处理器中,重新回归的Hyper Threading技术具有以下两大优势:首先,Nehalem拥有更大的内存带宽和更大的高速缓存,这要比传统的Pentium 4强上许多。因此,它将会为处理核心提供更充足的数据,具备更好的分支预测性能;其次,Nehalem比Pentium 4具备更为优秀的体系架构,每个核心都具备使用多线程的能力。

开启超线程特性后,Nehalem处理器的性能会大幅加强。在许多应用程序中,性能的提升都非常明显。它的性能提升幅度要远远高于Pentium 4处理器。

偷师无愧:整合内存控制器

Nehalem另外一个重大改进是,整合了内存控制器。这是Intel第一次将内存控制器由主板芯片组中转移到了处理器的核心内。同时我们也应该注意到,这个独特的内存控制器是一个货真价实的3通道DDR3内存控制器。这也就意味着你要在主板上同时插上3条DDR3内存,才能实现3通道带宽。3通道DDR3内存技术的出现,使得Nehalem拥有了足够大的内存带宽。这绝对有助于喂饱饥渴的处理核心。不过内存带宽的增加带来的副作用就是使得Nehalem的预取单元的工作更加忙碌。

全新总线登场:QPI

当Intel提出了将内存控制器集成在处理器核心内部的时候,它还需要一个与处理核心之间通信的高速链接。因此Quick Path Interconnect (QPI)总线也就由此诞生了。从字面上看去,它比Hyper Transport更有助于提升系统的效能。QPI每一个链接都是全双工的,每一个链接支持6.4GT/s的带宽。每一个2-byte宽度的链接每个方向可以得到12.8GB的带宽,由此一个单一的QPI链接足以提供25.6GB/s带宽。

可以说QPI总线,与AMD的HT总线相类似。现在开发人员最担心的就是NUMA非一致性平台。在由Nehalem组成的多处理器系统中,每一个处理器都将有自己的本地内存,并且应用程序需要保证处理器能找到与之相对应的内存。

写在最后:值得期待的次世代平台

得益于近几年桌面级多核心理器的高速发展,Nehalem架构已经进化得相对成熟而完善,而且无论是相对Core架构的一个改进也好,还是对Core的一个全面革新,其强劲的性能飞跃已是一个不争的事实。不过Intel这次最大革新并不是Nehalem,而是在处理器设计思想上的革命。以前为了提高处理器的性能,只是简单粗暴地增加处理器的时钟频率,现在为了提高处理器的效能,采用了多核心、多线程的思想,从而进一步提高处理器的执行效率,而不是运行频率。通过这样的思路,我们也就迎来了全新的Nehalem处理器,同时也迎来了一个全新的次世代平台。

小知识:Intel“Tick-Tock”微架构发展战略

“Tick-Tock”可以分为“Tick”与“Tock”,其中“Tick”代表新的制程,如65nm、45nm制程的升级通常在奇数年,比如2007年;而“Tock”代表微架构的升级,比如从酷睿2到Nehalem,通常在偶数年,如2008年。因此“Tick-Tock”的一个周期大约为两年,这也是Intel为迎合未来十年甚至更远的处理器市场发展制定的战略计划。

上一篇:你就是攒机达人 大学生黄金周攒机攻略 下一篇:播放全高清也得门当户对 1080P对LCD有啥要求