让计算能力驱动个人能力增长

时间:2022-10-08 06:33:58

让计算能力驱动个人能力增长

“欢迎进入多核时代,这是一个计算能力驱动我们的个人能力获得多重增长的时代。” 英特尔公司CTO兼企业技术事业部总监、英特尔资深院士贾斯汀(Justin Rattner)在主题演讲的开场白中,为人们展现的多核带给人们的深刻变化。贾斯汀表示:“今天,英特尔公司正在全球开发一系列多核处理器,新的产品线路图将会带来难以置信的性能提升和优异能效表现,将大大提升消费者在信息时代的驾驭能力。”

CPU步入交替的创新节奏

从90纳米,到65纳米,再到45纳米,乃至32纳米,英特尔在制程上不断创新。从NetBurst微架构到酷睿微架构,英特尔的架构创新为处理器的性能提升奠定了基础。

英特尔频繁的技术创新与产品升级,使许多用户,包括其合作伙伴应接不暇。对此,贾斯汀强调,英特尔将遵循稳定的创新节奏――交替创新:每隔两年推出新的支撑和新的微架构。他说:“英特尔将在奇数年推出新的制程,而在双数年推出新的微架构。”他透露,继去年推出酷睿微架构后,Nehalem和Gesher微架构将分别在2008和2010年问世。

目前,英特尔所有的处理器基本上都已采用65纳米制程。贾斯汀表示:“截至目前,英特尔已经推出了1.12亿个65纳米的处理器。65纳米制程技术已经到了它的生产高峰。而今年下半年,英特尔将投产45纳米的处理器,而32纳米制程技术将在2009年采用。”

能耗有望降低十倍

2005年9月,记者采访了在旧金山举行的2005秋季IDF,当时英特尔公司CEO欧德宁发出的呼吁令笔者记忆犹新:在5年内,让处理器的性能提高10倍,能耗降低10倍。

如今,欧德宁的这一呼吁正在逐步成为现实。对此,贾斯汀介绍说:“预计到2010年,处理器的能耗降低10倍的目标可以实现。”他进一步举例说:“在2006年,就处理器的功耗而言,笔记本是6瓦,桌面机是65瓦,服务器是85瓦。酷睿微架构的采用,大大降低了能耗。最近,我们推出了一个功耗仅有50瓦的服务器处理器,它使服务器的能耗降低了40%多。至强处理器的能耗是110瓦,而最近每个核的能耗达到了12瓦。由此可见,我们在降低用于服务器的处理器方面取得了非常大的进展。接下来,我们要在客户机上实现类似的能耗削减。我们刚刚宣布了英特尔正在引入一个低耗能的微架构,我们在降低每瓦能耗的情况下,会保持系统的一致性和兼容荣。为此,我们将同业界伙伴进行充分合作。”

万亿次运算刷新记录

在去年秋季的IDF上,英特尔就提出了万亿次计算,而在此次北京IDF大会上,贾斯汀展示了80核处理器的卓越应算性能。演示中,在工程师的现场操作下,该系统在190瓦供电的情况下成功创下了每秒2万亿次浮点运算的新记录。这是万亿次运算的首次亮相。据了解,该芯片目前还只处于演示研究阶段,尚无实物供用户使用。

80核处理器的诞生预示着超级计算机的成本有望大大降低,管理也将更加高效便捷。万亿级计算性能将为教育、娱乐、协同办公带来全新应用,同时推动个人电脑、服务器和掌上设备的高分辨率娱乐内容的丰富和创新。

四核与虚拟为服务器增效

四核自去年下半年以来,一直都是服务器领域的热点,虚拟技术虽然在这两年颇有些老生常谈的意味,但仍要将其划进服务器领域的热点里,怕是也没人反对。现在,这两个热点在英特尔春季IDF上相遇了,想像一下会发生什么?

2007 IDF上,浪潮和英特尔联合了全球首个四核服务器虚拟化基准测试数据,四核与虚拟化技术的相遇创造了比双核双路服务器系统效能提升91%、CPU占有率降低40%的全新效能。也就是说,如果你在使用双核双路服务器时每秒能处理100个事务,那么在新的基于虚拟技术的四核双路服务器上,你就能每秒处理多达191个事务。不言而喻,英特尔四核处理器与虚拟化技术的融合,给高效能服务器的发展带来了全新的机遇。

在此次IDF专为虚拟技术开设的展区内,一眼就能看到立在浪潮展台旁边的机柜。浪潮集团技术总监胡雷钧介绍说,这就是参加测试的浪潮四核双路服务器――英信NF380D。通过引入英特尔的虚拟化技术与浪潮的四核IFA+智能服务器架构,这台浪潮四核双路服务器可以运行BEA JVM、MySQL数据库、Exchange和Apache网络服务器,原本需要多台服务器的系统现在只需一台服务器即可完成,这样就使得最终用户可以灵活地分割和组合系统的资源,有效地为用户的每个不同应用提供一个合理的有效的资源空间。同时,通过使用四核处理器,可以得到更大的吞吐量和运行更多的事务处理,并可以运行更多的虚拟机,最终实现浪潮一直以来都十分推崇的高效能。

浪潮此次联合英特尔的最新基准测试数据是基于英特尔此次在IDF上展示的新的虚拟化基准测试工具vConsolidate进行的。据英特尔亚太研发有限公司中国服务器市场部总监刘钦华介绍,在选择实现最佳运作的服务器平台的时候,特别是虚拟化的应用层面比较上,至今没有统一的计算标准来衡量和反映虚拟化所带来的性能提升和IT基础建设整体拥有成本(TCO)的改善。在此次IDF上,英特尔与浪潮一同展示的新的vConsolidate评测工具,通过真实地模拟典型虚拟化部署环境中的负载来测试服务器虚拟化性能,最终帮助用户量化并选出具有更高系统资源利用率的“高效能”服务器。

数字家庭:架构 接入 移动

架构统摄平台

随着现代消费者的需求水涨船高,融合控制、选择、高清和社区这“4C”,也开始成为数字家庭下一个重要目标。

要想融合4C、融合电视与PC这两个孤岛,要求有一个高度一致、通用的架构平台,去统摄PC与消费电子产品,并且这个架构还需要有强大的处理能力。面对这些融合难点,英特尔下一步的重要战略就是推出更具通用性的处理架构平台,夯实PC与电视两个孤岛融合的基础,让“4C”融合速度更快,不断增进用户数字家庭的体验乐趣。架构统摄PC与电视的平台,成为搭建数字家庭的重中之重。

兼容更多接入

现在,电脑已成为一个媒体枢纽。为了让这个枢纽更好地为用户服务,它就必须具备更好、更快、更多的接入方式,从而保证用户获得充足的媒体数据。

在保证有线网络接入的同时,还要保证多种无线接入方式。这些接入可能是WiMAX,也可能是WiFi,或者其他更多的接入方式,芯片组的设计就需要更多考虑兼容这些接入的终端设备。为此,英特尔通过与包括设计商、内容开发商等各类伙伴的合作,开发出了众多能够让电脑兼容的产品与设备。

兼容更多的接入还需要电脑具备更强悍的性能,英特尔的计划也表明了这点。2007年第二季度,英特尔将推出三种不同的芯片组,支撑高性能的DDR3内存和前端总线以及Turbo内存技术,来满足主流机器的需求。同样这些新的芯片组也进一步增加了电脑兼容多种接入的能力。未来,电脑芯片组对各种接入的兼容性将决定数字家庭这个整体生态系统的发展速度。

终端高性能移动

当众多功能被越来越集中在一个体积甚小的产品上时,如何保证这些产品在移动中保持高运算速度、高数据传输率成为难题。为此,英特尔给出了一个解决方案,通过将最新推出的功耗只有35瓦的Santa Rosa CPU植入手机终端,手机将获得高性能处理速度,并且还可以通过802.11n连接其他数字家庭设备。而通过对Turbo内存技术的支持,则为今后性能的拓展提供了基础。

处理器:多核 万亿级计算

多核处理器节奏式升级

这是多核时代,双核已经不足以刺激用户的神经。在2006年四核产品之后,多核处理器的未来推进计划继续引发着关注。

按“tick-tock”产品战略,英特尔每年都会推出以增强的微体系架构或全新微体系架构开发的新制程技术。在基辛格的演讲当中,就涉及到英特尔即将推出的下一代45nm处理器家族Penryn以及Nehalem的详细信息。

在Penryn处理器之后,我们把目光聚焦到Nehalem处理器家族。英特尔将于2008年开始生产Nehalem处理器家族。除其他特征外,这些处理器在每个产品中都有1到8个以上的内核,还支持同步运行多线程,每个芯片可以同步运行2到16个线程;一些未来的Nehelem处理器还将提供诸如系统互联、集成内存控制器以及高性能集成图像引擎等选项。

万亿级十年后民用

当贾斯汀展示一枚指甲大小的芯片时,观众并没有意识到,就是这颗处理器居然实现了Tera(万亿)级运算,并通过高速路由连接起集成的80个内核。

该芯片是世界上首个具有万亿次浮点运算性能的可编程处理器,其运算性能与超级计算机类似,这是否意味着万亿级计算时代触手可及?英特尔给出的答案是5~10年,。

笔者不妨分享一些年初英特尔(中国)研发中心交流会上获得的技术细节。该80核处理器基于45nm制程,每个内核都有两个可编程的浮点引擎;尽管运算性能取得重大突破,其尺寸和耗电量却控制得非常出色,仅为275平方毫米的大小,与成人拇指相当,在以3.16GHz的频率执行每秒1万亿次浮点运算时,功耗仅为62瓦。

从技术实现的角度来看,该芯片采用了一系列首次应用的创新技术,使用“瓷砖片”设计是其显著特点,由计算单元和路由器组成的小内核像“瓷砖片”一样重复平铺开来,这样就很容易设计出多内核芯片;为了解决好内核与内核之间的通信问题,该芯片的另一大特点就是在芯片上具有网格状的“片上网络”,内核以网状格联网,内核间能通过5端口的传送路由器以超高带宽通信,在芯片内部以每秒万亿位的速度传输数据。

半导体:45nm 高k制程 光刻

在某种意义上,可以说半导体技术的进步是整个IT产业前进的基础。在这方面,英特尔一直投入非常多的精力。本次IDF上,英特尔展示了在半导体制造方面的新技术和规划。

45nm量产就在眼前

英特尔公司技术与制造事业部高级院士兼制程架构与集成部门总监马博勾勒出了英特尔的研发流程和未来的计划。英特尔在芯片方面的开发有三个阶段:研发阶段、开发阶段和生产阶段。马博透露,目前,英特尔的65nm的技术正处于量产阶段,是面向市场的主流产品。45nm的技术正在从开发阶段转向生产阶段,并将会很快投入量产。目前,45nm技术正在俄勒冈州的工厂进行早期的生产。同时,英特尔在亚利桑那州和以色列的工厂也即将投产45nm产品。英特尔还计划在新墨西哥建立一个新的工厂,在2008年下半年投产,生产45nm产品。根据英特尔每两年更新一次制程的计划,22nm的产品在2011年就会出现在用户身边。

破除漏电流的瓶颈

45nm的出现,带来了更小的晶体管和更高的密度。但同时它所面临的漏电等问题非常严重。英特尔开发的高K与金属栅极的技术,解决了这一难题。传统的晶体管架构已经使用了将近40年的时间了,虽然尺寸不断缩小,但是基本的部分没有什么变化。英特尔对晶体管的重大改进来自之前晶体管的栅极介质。英特尔在栅介质中用厚度更大的铪基高k材料替代了之前的二氧化硅。这种基于铪元素的高k介质具备良好的绝缘属性,同时可以在栅极及硅底层之间形成较高的场效应。高k的铪化合物比二氧化硅更厚的同时,仍然保持着理想的高场效特性,因此可以大幅度减少泄漏电流。高k栅介质与金属栅极组合,泄漏电流仅为之前使用二氧化硅材料的1/10;同时,因为场效提高,使得晶体管源极到漏极的驱动电流提升20%,源极到漏极的泄漏电流降低5倍以上。高k加金属栅极的升级,是晶体管一个最重大的变革和突破。

光刻加速制程前进

IDF上,英特尔还展示了下一步所探索的技术取向,其中之一就是超紫外线(EUV)光刻技术。

在半导体制造过程中,需要用光在晶元表面蚀刻形成电路。当制程进步时,所使用的光波波长也需要相应地缩小,45nm中应用的光波波长仅有193nm。从下图可以看出,一直以来,晶体管最小特征尺寸的发展速度大大超过了蚀刻光波长的发展速度。从180nm的半导体制造一直到65nm的半导体制造,蚀刻光波长一直保持在248nm。通过不断努力,终于使193nm的光刻应用于45nm的半导体制造,而按照目前英特尔的计划,它还将持续到32nm的半导体制造中。而超紫外线的波长仅为13nm,仅为目前使用的光波长的1/15,这可以说是革命性的提升。如果超紫外线蚀刻技术研发成功,将大大加快制程前进的步伐。

传统晶体管与高k栅介质+金属栅极晶体管的比较

企业级:节能 虚拟化 Tolapai

如何才能用更少的IT预算解决更多的问题?这可能是企业级用户最为关心的问题。在本次IDF大会上,英特尔描绘出了一幅未来的画面。

功耗承诺仍然有效

在2005年的IDF大会上,英特尔曾经宣称到2010年将CPU的功耗降低10倍。在本次IDF上,英特尔表示这一努力方向不会改变。大会上,英特尔公司高级副总裁兼数字企业事业部总经理帕特•基辛格介绍了英特尔的产品计划,其中包括一项针对英特尔高端多路服务器(研发代码为“Caneland”)的计划。四核和双核英特尔至强7300处理器将于今年第三季度面向刀片服务器市场推出80瓦和50瓦两种版本,其中,单核心功耗降低到了12.5W。基辛格还和Sun公司共同进行了一个演示,将其Solaris操作系统运行在采用致力于减少内存子系统耗电的英特尔动态功耗(Intel Dynamic Power)技术、基于英特尔至强5100系列处理器的系统上,在不影响性能的前提下,可以节省15%~20%的功耗。

虚拟化加速实用进程

对于服务器和客户机来讲,虚拟化都是非常重要的工具。通过虚拟化,用户可以采用更少的服务器来进行数据中心的规划,带来大量的IT系统成本节省。基辛格在大会上表示,英特尔和VMware正在合作,致力于为用户提供安全、强劲和稳定的虚拟化工具。同时,英特尔还和浪潮、联想等厂商合作,致力于制定一个对虚拟化环境的衡量标准。为了展现虚拟化系统在应用和管理上的优势,英特尔还和微软共同展示了虚拟化系统的运行。

Tolapai将安全整合

大会上,我们还看到了Tolapai,这是企业级“片上系统”(SoC)产品家族的第一款产品。它将在两地传输数据时,需要进行的加密、传输、解密等功能整合在单一芯片上,取代了以前的四芯片解决方案。通过整合,Tolapai预计将能使芯片规格缩小45%,功耗降低约20%,同时还可提高吞吐性能和处理器效率。Tolapai不仅仅提高了VPN,而且能给更多的应用带来性能的提高,比如扫描病毒等。基辛格在大会上表示,英特尔要做的就是以更加集成的方式提供解决方案。Tolapai只是这种理念的体现之一。英特尔还在进行更多这方面的研究。

Sun转投至强芯

采用4颗四核英特尔处理器的Sun 8000系统工程样板

在IDF大会上,我们看到了Sun公司和英特尔合作生产的新产品――Sun的刀片的8000系统。Sun 8000系统中,所有硬件资源都是模块化的,从电源,到刀片,到I/O,到硬盘,所有的东西都可以在使用的状况下替换,用户根本不需要关闭电源,可以保持系统的持续运行。同时Sun还展出了该系统的采用4颗至强7300四核处理器的产品样板。Sun宣布本季度将推出采用两颗同样处理器的产品。Sun公司表示,得益于英特尔的功耗管理的新技术,Sun可以通过动态电源管理器软件管理芯片组、CPU甚至I/O的电源。在IDF现场进行的演示中,在动态的电源管理器启动了以后,所演示的系统功耗减少了15%~20%左右,同时性能并没有下降。

软件:并行设计 工具编译

虽然多核心处理器已经成为燎原烈火,但现有软件对双核心的利用还远远不够。如何能够充分利用多核心的资源,已经成为摆在众多软件设计人员面前的难题。

并行软件设计遇大考

相比串行软件设计,并行软件的设计要复杂得多。并行程序可分为指令级并行、单指令多数据并行和多核并行三个层次。在并行程序设计中,设计人员首先要对程序进行结构化分析,以将程序需要执行的任务分割成几部分;之后,需要在程序中引入并行性,也就是将分割后的任务分配给不同的核心进行处理;然后,需要对程序的可靠性进行仔细检查;最后,将程序中任务分配做优化调整,以更好地利用多核心资源。

用工具简化工作

英特尔公司数字企业事业部院士兼编译器与架构高级开发部门总监罗杰飞在IDF上展示了利用英特尔的一系列工具来简化并行程序编辑工作的实例。

首先,罗杰飞展示了英特尔Vtune工具的运用。Vtune可以完成对程序进行结构化分析的工作。它可以生成程序的逻辑树,并通过Sampling Profile对程序中不同任务的循环次数、需要的时钟周期等进行分析,供程序设计人员参考。

同时,英特尔还提供了基于OpenMP循环语法结构的编译器,来帮助设计人员完成为每个内核创建一个线程以及为线程分配迭代的任务。它可以自动为需要分配的任务生成对应的语句,大大减少了设计人员的工作量。

在并行运算中,不同的线程在调用数据过程中可能出现数据争用问题,导致程序得出错误的结果。罗杰飞演示了使用英特尔线程检测器对程序进行检查的过程。线程检测器通过对程序中锁的设置按照逻辑顺序排列来检查可能出现的数据争用,并展示给设计人员。

最后,罗杰飞还展示了使用英特尔线程档案器查找竞争锁,以减小数据锁造成的并行性削减带来的资源浪费。

罗杰飞在现场展示了对一个质数运算程序的优化过程。由开始的串行程序,经过Vtune的分析和编译器的处理,成功转换成了并行程序,并利用线程检测器修正了程序中的错误。通过线程档案器对程序进行优化后,对多核心的利用从一开始的部分利用实现了对每个核心运算资源的充分利用。

微软虚拟化长袖善舞

IDF上,微软展示了运行于Windows系统的服务器,通过虚拟化,其上可以同时运行一个64位的和一个32位的Windows Server 2003系统、一个Linux系统和几个其它系统。当用户希望有一个单独的平台能够运行各种各样的操作系统时,就可以通过虚拟化的方式来完成。同时,通过进程管理器可以看到,在每个虚拟机里面,用户都可以访问所有的内核,充分利用多内核带来的性能优势。除此之外,在虚拟机上,用户还可以根据需要“热插拔”内存,当服务量增加,需要增加更大容量的内存资源时,可以在Windows Server的虚拟化环境中进行即时调节,整个调节过程非常简单,并不需要重新启动虚拟机,也不需要停止正在运行的服务。

上一篇:双向转诊系统可实施HL7标准 下一篇:麦德龙会员卡的启示