融合的故事

时间:2022-04-25 08:29:01

融合的故事

在正式开始本次对比评测之前,我们不妨先来聊聊融合的故事,看看CPU与GPU究竟是怎么走到一起的。

2008年,AMD在全球首次前瞻性提出“融聚未来”品牌理念,2011年1月5日,AMD在CES2011开幕之际正式了筹备多年的Fusion APU。AMD首发的“Brazos”属于低功耗平台,E系列APU定位轻薄笔记本、一体机、小型台式机,C系列APU定位高清小本、平板电脑、嵌入式等新兴设备,性价比和能耗比都很不错。2011年6月14日,代号为“Llano”的高性能A系列APU登场,首发平台代号为“Sabine”,针对笔记本电脑,分为A8、A6、A4三类产品共计七款处理器。而针对台式机的Llano APU也于同期面世。AMD的Fusion APU,中文名称就叫做加速处理器,它不只是将CPU和GPU的核心物理融合在一起这么简单,而是为了实现CPU和GPU的协同运算,最大限度的发挥两种处理器的优势,消除计算瓶颈,这也就是目前最热门的异构计算加速。

AMD最初为APU设定的目标,就是要将传统的北桥、四核心CPU、中端DX11独显融合在一颗芯片上面,而且这三颗传统的芯片都应该拥有各自完整的功能。此外,Llano的瘦身更是前无古人,首先,Llano APU采用了GlobalFoundries最新的32nm工艺制造而成,同样的晶体管规模,32nm工艺制造出来的核心面积是45nm产品的70%;其次,CPU和GPU共享内存控制器;最后,CPU部分没有三级缓存,而三级缓存耗费的晶体管不比CPU核心少。通过AMD Phenom II X4四核处理器的芯片架构图来看,三级缓存耗费了大量的晶体管,要比四颗核心加起来所占芯片面积还要大。可如此巨大的晶体管开销,并不能带来翻倍的性能提升。因此,在设计Llano APU时,AMD直接删掉了三级缓存,这样就能给GPU腾出很大的空间。

AMD的Phenom II全系列产品(X6/X4/X3/X2),虽然三级缓存大小不尽相同,但其每颗核心所属二级缓存都是512KB。由Phenom II屏蔽掉三级缓存而来的Athlon II X4/X3,其二级缓存也都是512KB。由此可见Llano APU并没有直接沿用Phenom II的架构,而是做了一些调整与优化。

近期,AMD刚刚了新一代APU产品代号为“Trinity”,新APU桌面平台代号为“Virgo”,移动平台为“Comal”,新一代APU将采用GlobalFoundries 32nm SOI HKMG工艺制造,拥有2-4个基于改进的推土机架构CPU核心,核心代号为“Piledriver”,可以说这一部分的改进还是比较大的,因为上一代Llano的CPU部分还是采用的较老的K10架构,融合的GPU部分也进行了大刀阔斧的改进,HD6000核心将被采用VLIW4(Cayman核心的HD6900就是采用的这种架构)架构的新图形核心取代。据其他媒体评测结果看,AMD在处理器性能和图形性能上都有大幅度提升。

而在竞争对手Intel方面,Intel早先了Clarkdale核心的Core i3/i5处理器,对外宣称也将CPU与GPU进行了全面整合。但所谓Clarkdale核心,其实与Intel上代Core 2平台区别不大,它的内存控制器、集成显卡、PCI-E控制器都在北桥中,将CPU和北桥封装在一起并不能提升性能,只是起到了简化主板的作用。由于Clarkdale没有整合内存控制器,这导致其内存性能低下,性能方面并没有带来惊喜。但凭借Intel先进的32nm工艺所赐,在功耗和发热的表现上算是合格。

而Intel的Atom N450同样不能算作是融合的芯片,它是一颗单芯片整合了内存控制器和集成显卡的处理器,看上去似乎更像一颗CPU+GPU整合式处理器,也似乎达到了真正意义上的“融合”,但哪知Atom的架构实际上更为落后,Clarkdale的CPU和北桥之间好歹使用了新一代的QPI总线互联,而新Atom的CPU和北桥虽然在同一颗芯片之内,但它们之间却依然使用老迈的FSB总线。新的Atom本质上也是将CPU和北桥简单的放在一起,只是由于晶体管数较少,更容易整合,没必要做成两颗芯片然后再封装在一起。但在内部架构方面,落后的FSB总线拖了后腿,CPU和北桥(包括内存控制器和显卡)之间的瓶颈依然存在,功耗非常给力,性能却依然上不去。

2011年初,伴随SandyBridge架构处理器正式,GPU部分真正融入了CPU核心内部,如此便可以充分利用CPU部分的大容量三级缓存以及低延迟的内存控制器,共享内存带宽,对于CPU来说最多就是加张床添双筷子的事儿,而对于GPU来说则是能省的全都省了。相比之前的GPU数据通过显存控制器到PCL-E到北桥内存控制器再到前端FSP总线直至CPU这样的长途跋涉,现在就封在一个共享L3缓存的晶片里自然延时大大减小,效率有一定提升,而捎带手也让GPU沾到了32nm的先进CPU工艺。虽然此番Intel令人刮目相看,不过话又说回来,由于Intel没有独立显卡的制造经验,抛开GPU部分的性能暂且不谈,不支持OpenCL、DirectCompute等并行计算技术就已差人一等。换言之,SandyBridge依然无法实现CPU和GPU的异构计算加速,SandyBridge内部的媒体处理器功能也相对单一,无法实现通用计算。

Intel虽然行了融聚之实,但一则根不红苗不正,走的是CPU整合集显的路子,二则有肉体无灵魂,不支持DX11,不支持异构计算。

故事还在继续。基于Ivy Bridge架构的英特尔第三代智能酷睿处理器在2012年4月正式。新一代IVB架构处理器除了采用全新的22nm 3D晶体管工艺之外,最令人瞩目的提升就要数新一代HD4000核芯显卡了。应该说,HD4000核芯显卡还是有进步的,但其性能依然无法与AMD APU所配备的独显核心相抗衡。另外,值得一提的是,虽然新一代Ivy Bridge Core处理器在核芯显卡方面取得了进步,但Core i7-3770K这种级别的顶级处理器内置HD4000核芯显卡的意义显然不大,很难想象采购这种顶级处理器的高端玩家只满足于整合平台,即便是千元价位以上的Core i5处理器同样如此。而即将在第三季度的Ivy Bridge Core i3处理器搭载新一代核芯显卡的意义显然更加明显,不过其搭载的是相比HD4000性能更低一个档次的HD2500核显,至少从目前Intel的产品规划中是如此,因此在主流的融合/整合平台市场竞争中,Ivy Bridge更难以对型号丰富的APU产品构成威胁。

在未来,用户对个人电脑的需求不再满足于计算和文档的应用,需求日益多元化和图形化,特别是一机多能对硬件提出了更高的要求。届时,AMD的APU产品将会满足客户在超轻薄笔记本、平板电脑、一体机、台式机和服务器领域日益增长的一系列关键性需求:低功耗、云计算和新兴市场。

上一篇:3D液晶也玩IPS 华硕首款偏光式3D显示器 下一篇:容量提升7%