AMD多核技术

时间:2022-10-10 09:39:07

AMD多核技术

从1998年开始,AMD的K8架构就已经浮出水面。虽说K8架构在很长一段时间内都领先于Intel,但是9年之后,K8也不得不面临“明日黄花”的尴尬。反对频率至上的AMD一直强调流水线效率,因此即便如今K8处理器的主频只有2GHz左右,但是其性能依旧非常不错。但是,面对Intel全新的核心架构,K8架构已显现出劣势,其中内存控制器和整数执行单元方面已经明显落后。更为重要的是,AMD已经在65纳米制作工艺方面落后于Intel,因此今后的主频大战肯定再次陷于被动。在这样的情况下,重新研发新核心架构是必然的。

创新的双核设计

AMD K8处理器从一开始设计时就考虑到了添加第二个内核,两个CPU内核通过使用系统请求接口SRI,使用相同的超传输(HyperTransport)技术和内存控制器,兼容90nm单内核处理器所使用的940引脚接口。

AMD直连架构通过超传输技术让CPU内核直接跟外部输入/输出相连,不通过前端总线,这使得每个内核都自己的高速缓存可用,都有自己的输入/输出,没有资源争抢的问题,实现双核和多核更容易。

AMD的双核CPU跟现有单核CPU接口规格、功耗一样,因此从单核换成双核,不需要更换芯片组、主板、电源,只需要升级BIOS软件、拔下单核处理器、插上双核处理器就行了。芯片组、主板、电源厂商不用投入新的研发成本,价格会按半导体市场的规律自然降低,用户现有的设备也可以通过升级CPU提升性能。因此,AMD多核技术在应用上具备一个非常大的优势,那就是功耗不变。也许对于普通用户来说功耗的意义并不大,但对于高密度的服务器如数据中心来说,就具备了很大的优势,不需要增加额外的散热设备,就可以立即提升系统的性能,降低总拥有成本。

AMD多核处理器的另外一大优势便是内部集成内存控制器。这种大胆的设计方案一度被认为会拖垮AMD,因为兼容性问题和产品可升级空间都令用户非常头痛。但是,内置内存控制器的好处也是极具诱惑力的,并且在多核时挥出了更大的作用。通过CPU内置内存控制器,每个内核可以有效控制内存控制器工作在与处理器内核同样的频率上,而且由于内存与处理器之间的数据传输无需经过北桥,可以有效降低传输延迟。打个比方,这就如同将货物仓库直接搬到了加工车间旁边,大大减少了原材料/制成品在货物仓库和加工车间之间往返运输所需时间,显著地提高了生产效率。这样一来,系统的整体性能也得到了提升,尤其是多核的工作效率更是得到加强。

HT 3.0与逆向超线程

K10(Agena FX)将是真正为多核设计的新一代处理器,而且直接使用更为先进的12通道HyperTransport 3.0连接四核。在AMD看来,多核并非仅仅是并行运算,在单任务处理中也应当发挥作用。K10的流水线级数将保持和K8相同,但是数据预取单元使用存储接口进行标签查找,此时可以避免标签查找可能带来的高延迟。K10核心的整数担心也进行了大幅度改进,核心中已经内置3个64bit的整数执行单元,这将帮助这款全新的架构达到更加理想的整数性能。此外,K10核心还将集成128KB一级缓存、512KB~1MB二级缓存和首次在桌面系统引入的2MB三级缓存,这进一步提升了它的性能表现。

在整个K10架构中,被成为逆向超线程的Anti-HT技术非常引人瞩目。众所周知,Intel超线程技术在一个物理处理器中模拟两个虚拟处理器,从而在多线程应用中获得性能提高。而AMD的Anti-HT技术恰恰相反,它允许你将两个物理处理器作为一个虚拟处理器使用,从而在应用程序包括非多多线程应用程序中也能获得性能提高。其实,对于多核运作效率,厂商都非常担心,而软件开发商的优化力度也无法令人彻底放心。因此,逆向超线程可以看作是一种优化多核心的技术,帮助多核处理器顺利在普通应用程序中获得更加理想的性能表现。

Barcelona四核方案

AMD Barcelona四核方案一直被视为超强工作站领域最具性价比的多核解决方案之一。Barcelona在一块硅芯片上集成了4个硬件内核,每个内核拥有独立的512KB二级缓存,这样Barcelona总共就有2MB二级缓存。在此基础上Barcelona还拥有2MB的共享三级缓存,这样各个核心缓存同步化就可通过共享的三级缓存进行。不难看出,Barcelona的耦合程度非常紧密,四核协作效率甚至优于双芯片的Core 2 Quad。

目前,Intel Core 2 Quad是现在市场上惟一可以买到的四核x86处理器,而Barcelona则要到2007年下半年才会上市。尽管Barcelona相比Core 2 Quad略有一些技术优势,但是并不明显。因此,未来的竞争依旧会非常残酷。

对于四核处理器而言,我们关注的焦点还包括功耗,毕竟4个内核所带来的能耗令人非常担忧。Barcelona最吸引人的莫过于被称为“动态独立核心管理(DICE)”的四核电源管理系统。DICE不仅会根据系统负载智能分配各内核需要执行的任务,还可以在内核处于空闲状态的时候将其转入完全休眠状态,从而大幅节省功耗。

由于处理器中的每个内核都具有自己独立的PLL和时钟频率,因此AMD能更好地协调其负载和功耗。根据资料显示,单核100%负载、三核33%负载时的功耗仅为全载时候的60%,而单核100%负载、单核50%负载、两核关闭时候更是只有45%。这也是AMD宣称“四核性能、双核功耗”的技术保障。

链 接:AMD流处理器

流运算技术利用成熟的大规模并行处理器,这些处理器通常用于计算和在显示器上渲染数百万个像素、每秒数百次的3D图形计算。流运算技术具备强大的处理能力,适用于各类科学、商业和消费计算应用,使机构能够处理海量的信息,同时大大缩短处理时间。AMD流处理器是同类产品中首款专门用于解决企业流运算问题的硬件,现在的产品基于R580图形芯片,这也被视为是一种多核并行技术的典型应用。但是,流处理器短期内应用在PC或是服务器领域是不可能的,它的单一执行方式令其只能满足某一种简单而高精度的计算要求。

上一篇:电子信息百强企业规模日益壮大结构调整成未来... 下一篇:人民邮电出版社 三种思路并行 探索盈利模式