“推”倒Intel?

时间:2022-10-12 06:48:43

近年来,AMD在处理器市场混的也算不错,特别是几款高性价比的双核,三核和四核处理器上市赚足了消费者眼球,也挣到了银子。不过随着Intel的Core i系列处理器的推出,AMD处理器在性能上毫无优势可言了,在Intel强悍的技术实力和领先的市场份额面前,AMD显得有点力不从心。因此,AMD只有再次进行技术创新,才有希望改变直被Intel所压迫的局面。

在今年8月底至9月期间,AMD向外界了大量下代处理器Bulldozer(中文代号“推土机”)的信息。很显然,AMD将希望全部寄托在了BuI dozer处理器身上!

Bulldozer处理器将会首先应用于服务器领域,预计首批芯片将是代号为“Interlages”的服务器处理器,核心数在12个至16个之间;而针对桌面服务器市场,Bulldozer将会有4个、6个以及8个核心三个版本,三级缓存容量为8MB:最后,桌面处理器产品代号“Zambezi”,拥有4个或8个核心。另外,桌面版本的Bulldozer处理器将会采用AM3+接口,而AM3+接口的处理器不能使用在目前的AM3插座主板上,但是现在的AM3接口处理器却能用于未来的AM3+新插座主板。简单地说,现在是新处理器可用于旧主板,今后是旧处理器可用于新主板。

虽然我们不能够在2010年内看到Bulldozer处理器的真容,但是通过目前仅有的资料,我们还是能够窥探出一些Bulldozer处理器将拥有的强大性能。

灵活多变的模块化设计

AMD的Bulldozer是在K10之后推出的全新一代处理器架构,在核心架构及功能性上与K10有较大的改变。相对于目前AMD主流处理器的架构,Bulldozer核心最大的亮点就是引入了模块化设计,这让处理器在功能更加灵活的基础上更容易控制成本。目前,无论是羿龙(Phenom)四核,三核还是双核处理器的内核结构都是统一采用凹核(或者更多核)的物理结构,再根据市场策略对内核进行有选择的屏蔽,这样难以控制成本,而Bullbozer处理器所引入的模块化设计刚好可以解决这个问题。

1.Bullbozer如何实现模块化设计

Bulldozer在核心设计方面每两个核心组成一个单独的单元(称之为“核心模块”,两块物理内核集成到一个模块中),比如双核处理器只需要集成一个模块就可以了,即使是八核处理器也只需要集成四个模块,这让产品生产及成本控制更加具有灵活性。处理器核心模块的两个核心各自拥有一级缓存,但是共享二级缓存和预取,解码单元,所有的“核心模块”共享8MB三级缓存和北桥模块。

2.未来AMD处理器的内核数量如何定义

未来的新架构四核心处理器指的是四个这样的模块呢,还是四个计算核心呢?AMD对此给出的回复是:“将每个拥有双整数核心的Bulldozer模块视为一个独立的单元就对了。”显然,AMD在这里可以回避单纯的核心数量问题,更强调两两组成的有机整体,所以在面对推土机架构处理器的时候我们可以说它是四核心、八核心的,也可以说成是双模块,四模块的。

高效的集群多线程架构

1.多线程(SMT)、多核心(CMP)都存在不少缺点

尽管多线程,多核和Bulldozer在线程并行执行方面是相同的,但是内核的分区却截然不同。多线程就是在一个单个的处理核心内同时执行多个工作线程,多核心则是通过集成多个处理内核提升处理能力。

现在主流的多核处理器都是用了CMP技术,而像Pentium 4、Core i7这样的处理器所谓的“超线程技术”则属于多线程技术,而Bulldozer是基于集群多线程架构(即Cluster-Based Multi-threading,简称CMT)。Bulldozer的内核模块是一个可以同时运行两个线程的处理组件,两个内核可以执行两个完全不会相互干扰的线程。

2.浮点和整数计算性能大幅提升

Bulldozer所采用的集群多线程架构之所以能实现如此高的性能,其中一个大原因就是AMD增加7CPU的运算单元,每一个模块都具备可以将一个大任务细分为多个并行任务的能力。Bull-dozer模块的两个核心支持执行两个线程,会共享对延迟要求较高的功能,好处是比两个线程共享一个核心有更高的伸缩性和可预测性。

Bulldozer这种将两个线程的整数运算独立开来的设计可以更有效地提高处理器在基本应用中的性能。由于Intel的Nehalem架构的超线程技术是两个硬件线程共享3组运算单元,冲突在所难免,而Bulldozer则是两个硬件线程独享4个整数运算单元,性能提升将会更加明显。

3.分支预测与功耗优化

Bulldozer架构拥有条更深层的管线,这条管线依靠改进型分支预测与预取器来解决由错误的分支预测造成的瓶颈问题。但与旧架构不同,预测与读取管线都运行在非耦合状态下。未提取地址序列由预测器创建,允许取逻辑通过这个序列并与指令缓存中的数据进行对比。

Bulldozer还在能效、电源管理方面做了大量努力,微架构方面支持资源动态共享,数据转移最小化,大量时钟和电源栅极,并增加了主动电源管理(APM),支持芯片级的核心功耗栅极。根据不同的工作负载,芯片功耗也会实时相应调整,同时给超频留下了空间。

Bulldozer还将支持Turbo Core特性,而且会比Thuban(Phen-om Ⅱ X6)里的有所改进,将会有一些增强使其动力更强劲。这是服务器处理器第一次引入Turbo Core技术。我们预计这会在使用单线程程序的时候带来显著性能提升,同时对大负载量也会有帮助。

总结:Bulldozer处理器在架构设计上面做出了重要的改变,而且就目前来看这样的改变是相当重要,而且改变得相当出色。模块化的设计和集群多线程架构不但能够灵活地实现多线程处理的需求,而且还能降低不必要的成本浪费。

上一篇:多硬盘时代RAID与SSD的新玩法 下一篇:操控无界限 奥尼肯扬