AMD双管齐下竞逐未来计算高点

时间:2022-10-20 08:25:29

AMD双管齐下竞逐未来计算高点

2006年,AMD不惜工本,耗资54亿美元收购了ATi。在之后的几年内,针对这一并购的讨论一直没有停息。在10月22日的AMD创新技术大会上,这一并购的成效得到了集中的展示。此次大会上,AMD不但正式了AMD第二代DirectX 11显卡Radeon HD 6800系列,还对外曝光了AMD代号为“Bulldozer”和“Bobcat”的下一代处理器核心架构。更重要的是,AMD还首次在华展示了其APU(加速处理单元)产品的晶圆和技术指标。“Fusion‘融聚’战略,将成为AMD的战略主轴。Fusion融聚概念,将成为未来计算创新的基石。”AMD全球副总裁、大中华区总经理王正福的话昭示着CPU与GPU的融合走上了快车道。

新显卡执行效率大幅提升

“Barts核心的每平方毫米性能比上一代产品提高了35%。”AMD全球图形首席技术官Eric Demers谈到AMD新一代显卡Radeon HD 6800系列时充满自信。

从指标来看,AMD Radeon HD 6870与上一代产品Radeon HD 5850相比,尺寸、晶体管数量和流处理器数量不但没有增加,反而减少了。但是,其几何输出能力却大幅度提升,浮点运算能力也达到了每秒2万亿次。这种改变得益于更加优秀的架构。记者了解到,在HD6000系列产品中,AMD将HD5000系列中的一组前端超线程发送器增加到两组,使得核心效率大幅度提升。

除了运算性能得到提升之外,AMD还在新一代显卡中应用了很多创新技术。

前代产品中,能够让用户组建多屏显示系统的宽域(Eyefinity)技术得到了用户的好评。在新一代产品中,AMD再一次增强了宽域技术。第二代宽域技术允许用户更加灵活地配置自己的多屏幕显示系统,以取得更优秀的视觉效果。

针对今年开始热起来的3D显示,AMD也提供了很好的支持。与一些公司采用的专属方案不同,AMD提出了“开放式的3D立体方案”的说法。借助通用的软硬件接口,用户可以自由采用来自不同厂商的3D立体转换软件、视频和蓝光3D播放软件、3D显示设备、3D立体眼镜和发射器,这有望大幅度减少搭建3D系统的成本。

另外,针对DX11中最为重要的曲面细分等技术性能,AMD新一代显卡也获得了极大的提升。

双车道提升计算效率

“传统的支持多线程的方法有SMT和CMP,这两种方法都有各自的缺点。”AMD全球服务器CTO Don Newell用交通来比喻处理器中的不同线程。他认为,SMT方式将两个不同线程施加到单核心上,就像是将两个车道的车并入同一个车道,会造成拥堵;而CMP为每个线程提供专用核心,则像是为两路车各提供一条道路,每条道路上都存在空置浪费现象。

为了解决这种现象,AMD在下一代x86处理器中做出了调整。

在AMD下一代高性能处理器核心架构Bulldozer中,AMD将两个专用的整数内核与一个共享的浮点计算单元结合在一起。这样一来,不同线程一方面都有自己的“车道”,同时共享了浮点调度单元和二级缓存,实现了能效比的提升。

以一组Bulldozer模块为基础,加入共享的三级缓存和系统总线、内存控制器和北桥控制器,就可以形成多核芯片。这也加快了芯片的开发速度。Don Newell表示,Bulldozer将是AMD下一代高性能处理器的核心技术,它具有非常高的性价比和非常低的功耗,具有竞争优势。

另一方面,针对发展越来越快的移动市场,AMD同样提供了自己的方案。Bobcat就是AMD针对移动市场开发的处理器方案。Bobcat模块具有独立的整数调度和浮点调度器,其核心功耗低于一瓦。Don Newell表示,Bobcat会被用在AMD的融聚产品――APU Ontario 和 Zacate 中。

Ontario整体功耗仅9瓦

CPU和GPU之争由来已久,而APU的出现也许将为两者提供一种融洽的未来。在这次大会上,AMD首次在北京展示了其最新的Fusion产品的晶圆,APU正式投入使用已经指日可待。据悉,首款基于Fusion的APU产品(加速处理单元)将会在今年年底批量供货,基于此的系统预计于明年年初上市。

AMD提出的APU概念是指将CPU和GPU真正地融合在一起,完全置于一颗芯片当中,从而为用户同时提供高计算性能以及更强的视觉体验。AMD公布,其代号为Ontario的APU功耗已经降到了只有9瓦,而另一款APU Zacate的功耗为18瓦。两者都采用了Bobcat处理器核心,并内置了支持DX11的高性能显示核心。两者之中,Ontario所面向的是轻便型笔记本市场;Zacate面向的是超轻薄笔记本、主流笔记本、一体机等市场。

另外,AMD还在现场展示了其高端APU――Llano的晶圆,并现场演示了Llano的运行Demo。在同时执行处理器及高清影片播放应用时,微软的nBody DirectCompute应用测试显示Llano可达到30 GFLOPS的运算性能。这个演示预览了Llano的强大运算能力, 以至于现场观众都情不自禁地鼓起掌来。

上一篇:千机变 第42期 下一篇:异构计算成高性能计算最优选择