直面异构计算

时间:2022-10-01 09:20:31

直面异构计算

五年前的战略构想,一年前的首次实物展示,今年年初的盛况,踏着融聚的脚步,APU(加速处理器)终于来了。如果说,主要面向移动计算领域的C系列和E系列APU还无法令广大DIY用户近距离领略到这一全新异构计算平台的威力,那么随着代号Llano的A系列APU问世,真正的盛宴已经到来。五年的期待终成真,传说中的APU,到底哪里不一样?让Llano告诉我们答案。

什么是APU

用最精练的语言来表达,APU=CPU+GPU,这是APU家族产品的共性。从芯片结构上看,APU浓缩了传统意义上的北桥芯片、一颗x86 CPU,以及一个DirectX 11标准的GPU核心;而从广义的运算架构来理解,APU融合了两种完全不同的计算形态――由CPU代表的串行计算与GPU代表的并行计算,这是业界期待已久的一场融聚。

作为AMD的一项长远产品规划,APU家族全面覆盖桌面与移动平台。今年年初的CES大展期间,AMD了定位超轻薄、入门级移动、一体机和高清小本市场的E系列与C系列APU,以分别低至18W和9W的TDP提供不俗的运算性能。6月中旬,AMD又推出了面向性能级市场,代号Llano的A系列APU,加速处理器最强音登场。

Llano的杀手锏

与E系列和C系列相比,代号Llano的A系列APU在x86运算性能、图形性能及加速计算性能方面有了质的飞跃。以A-3850为例,它搭载了一颗从“Stars”架构优化而来、主频2.9GHz的x86四核CPU,每个核心配备1MB二级缓存,四个核心共4MB;而GPU部分则是一颗运行在600MHz、拥有400个流处理单元的Radeon HD 6550D。四核CPU与高性能GPU的融合并未带来可观的晶体管开销,这其中GlobalFoundries的32nm工艺功不可没,出色的工艺帮助AMD将Llano的芯片尺寸控制在228平方毫米,TDP也只有100W。

Llano的高性能绝非来自于两部分高规格功能单元的堆叠,优秀的架构设计是其中关键。Llano的CPU和GPU采用了共用内存控制器的设计,双通道共128-bit,这一方面会大大降低GPU从内存获取数据的延迟,另一方面也为APU的异构计算提供强有力的支持,CPU与GPU通过内存直接交换数据,效率无疑更高。

Llano的另一大“杀手锏”来自于AMD独有的双显卡技术,与2008年提出Hybrid CrossFireX(混合交火)时的情形类似,Llano的双显卡技术允许用户接驳一块Radeon HD独立显卡与APU内置的GPU核心进行混合交火(最高可支持Radeon HD 6670),由此可以获得最多75%的图形性能提升。相比之下,Z68系统的Virtu技术虽然允许双显卡同时工作,却无法让二者同时对某一应用程序加速,这也是一大关键区别。

Llano APU还有一项特长,那就是对加速计算的支持。在操作系统和软件应用的支持下,APU可实时智能分配CPU与GPU擅长的工作,真正实现“协同计算、彼此加速”。实际上,加速计算的需求无处不在,其应用也日趋广泛。例如,微软的IE9引入了GPU支持的HTML5规范,网页开发者能够创建流畅、实景式的、越来越美妙的互联网体验;Flash 10.2 的Stage Video硬件加速让支持此技术的网站可以快速地利用APU的硬件加速性能,将视频管线中的CPU负载降到最低,以更高的效率为用户带来更流畅的视频播放。类似的加速计算应用在今后将更为丰富,APU将拥有更广泛的施展舞台。

直面Sandy Bridge

作为面向桌面级市场的产品,Llano APU的问世无疑令广大DIY用户兴奋不已,那么,与另一大异构计算解决方案――Sandy Bridge平台相比,Llano APU的表现如何?我们设置了两套截然不同的测试环境,全方位对比二者在实际应用场景中的表现。用于比对的两套平台分别为A8-3850+A75和Core i5-2500K+Z68,在第一个测试环节,我们着重对比两套系统在无独立显卡时的性能差异,A8-3850融合的Radeon HD 6550D独显核心将直面Core i5-2500K的HD Graphics 3000核芯显卡;而在第二个环节,两套系统中均接入Radeon HD 6570独显,以相同的项目再次进行测试比对,相信一定能帮助大家找到一些感兴趣的元素。

集显平台测试

在集显测试环节,我们除了考查两套平台的整体性能表现,还将对A8-3850与Core i7-2500K各自的图形核心进行考量。需要说明的是,由于Radeon HD 6550D支持DX11而HD Graphics 3000仅支持DX10.1,因此在一些DX11游戏测试环节,为方便比对,我们仅测试二者同时支持的标准。

由测试可见,尽管i5-2500K性能不俗,但凡需要更多图形运算能力的场景,A8-3850的优势就会非常明显,拥有400个流处理器的Radeon HD 6550D起到关键作用。值得一提的是,即便在1920×1080的高分辨率环境,面对《孤岛危机:弹头》,在“Performance”设置下依然能跑出近40fps的分数,这在以往根本不可想象。

此外,由于有着高性能GPU的助阵,串行计算与并行计算之间更为均衡,使得A8-3850在异构性能测试中也有不小的优势。这项测试采用的HCBenchmark软件是中国计量科学院开发,被称为全球第一款真正的异构计算基准测试工具,能够同时调用CPU和GPU的计算资源。它的测试项目包括办公应用、视频体验、上网体验和游戏体验四部分,测试时会自动识别系统的硬件设备,将计算量按需分配给CPU或者GPU来执行,如果GPU不支持加速计算,就会全部交给CPU来执行。可以看到,虽然i5-2500K在CineBench、wPrime、WinRAR及PCMark等常规测试项中占优,但在异构测试环节,A8-3850有着近20%的优势。

游戏性能方面,A8-3850相比i5-2500K优势非常明显,1920×1080分辨率和中低画质下能很好地满足流畅度需求,一些项目中的领先幅度超过50%,此外,由于支持DX11,因此适用面也更为广泛。

独显平台测试

当系统中接入Radeon HD 6570独显后,测试环境又变得有所不同,Llano APU的双显卡技术得以发挥,HD 6550D与HD 6570交火组成HD 6630D2,性能比之前的单显卡平台有了质的飞跃。对比Core i5-2500K与HD 6570独显的组合,A8-3850双显平台在多数反映图形性能的测试中领先,仅有个别项目稍稍落后。

写在最后Llano APU的问世为DIY用户带来了耳目一新的体验。以A8-3850为代表的Llano APU家族将强大的四核心x86运算性能与DirectX 11级别的图形处理能力熔于一炉,加上独有的双显卡技术,可以帮助用户在各种复杂应用环境中游刃有余。与竞争对手的i5-2500K相比,A8-3850在图形性能方面表现出的优势非常明显,激活双显卡技术后,更是可以达到主流中端显卡的水平。平台搭配方面,A75芯片组对USB 3.0的原生支持能更好地迎合目前的主流市场需求,更多的SATA 6Gbps接口也与大容量、高性能存储设备的发展趋势相吻合。

而APU的融聚特性更是为DIY打开了新局面,DIYer打造高性能、小尺寸PC不再有任何障碍,换句话说,以往需要借助笨重的台式机方能获得的体验,如今利用搭载Llano APU的Mini PC即唾手可得,功耗控制更是不可同日而语。此外,由CPU和GPU融合而来的异构运算系统,更可智能判断和分配适合CPU或者GPU运行的工作负载,提高数据处理效率,从而达到应用加速的效果,真正实现“协同计算、彼此加速”。

对于产业界而言,Llano APU为处于低迷状态中的厂商们带来了新机遇。系统设计商从此可以摆脱性能、功耗与价格无法兼顾的束缚,随心所欲地发挥自己的想象力创造出更为强大、更具特色的产品。而借助Llano APU强大的加速计算能力,软件社区将能轻松地借助这一平台开发出大量适用于APU的应用软件,从而大举加速实现声音、触摸、手势和表情识别这些目前的处理器难以应付的功能。

五年构想终成真,加速计算时代汹涌而至,Llano APU早已准备就绪,你呢?

上一篇:口袋里的3G世界 下一篇:芬香魅力 妖艳动人