总裁历军披露HPC路线图 曙光5000捅破百万亿次天花板

时间:2022-06-29 08:47:27

曙光总裁历军表示,曙光高性能计算机未来将会越来越多地采用国产处理器,以保证国家战略装备的安全。

今年年底,全球超级计算机TOP500名单出炉的时候,中国品牌――曙光5000或将出现在前十名之列。

6月24日,曙光公司将与上海超级计算中心在京举行签约仪式,这意味着国家“863”计划重大成果――运算速度超百万亿次的曙光5000高性能计算机年底将正式落户上海。

曙光总裁历军6月16日约见本报记者,首度完整披露了曙光高性能计算机未来前行的路线图。

运算速度提高20倍 每日电费仅翻一番

时下,绿色、环保、节能已经成为一种时尚,在高性能计算机的研发中,这些因素当然是在考虑之列。

曙光4000的功耗是300多千瓦,一天的电费达到数千元之多;与之相比,曙光5000性能提高了20倍,功耗仅为700多千瓦,相当于电费仅翻了一番。中科院计算所、上海超级计算中心和曙光公司三方的研发人员采用了什么技术手段,使得曙光5000实现了环保节能的要求?

历军透露,曙光5000采用了低功耗的CPU,对降低整机的功耗、提高可靠性起到了非常重要的作用。曙光最新开发的集群管理系统GridView,本身支持动态的功耗管理,平均功耗大概降低20%左右。

除了高性能计算机本身的功耗,还有一部分是为了系统的正常运行所采取的制冷措施带来的功耗。传统高性能计算机使用方式都是放在一个机房里,如果机房面积是500平方米,高度是2米,那就是1000立方米的空间,要对机房整体制冷,其实效率很低的。

据了解,曙光5000从结构上进行了改变,把机柜系统做成密闭的系统,采用准水冷,即水冷和风冷相结合的方式――在机器内部是风冷的,机器外面是水冷。只在系统内部冷却,而机房里不用增加其他制冷设备,只是维持基本的舒适室温,这样能大幅度节省空调的耗电量。

向上突破向下延展 较量中端应用市场

高性能计算机向来是国家科技竞争力的主要体现,它一般用以满足国家的战略应用,在石油勘探、基因研究、航天器设计等领域,我们都能看到它的身影。曙光5000可以说已经站上了国家超级计算机的顶峰,然而它每百万亿次1亿元的价格,又决定了它不可能实现更广泛的应用。在我们津津乐道曙光5000创造新纪录的同时,未来中国高性能计算机将沿着怎样的脉络发展?历军用梳理路线图的方式,给出了“向上突破,向下延伸,较量中端”的思路。

所谓向上突破,就是要秉承曙光肩负的民族责任,让每一代产品都能不断打破中国高性能计算机的纪录,体现国家水平和实力,“我们捅破天花板的大系统会一代一代地做下去,这是一个方向”。

向下延伸就是要实现高性能计算机的小型化,这是一个需求很广泛的市场。曙光前段时间已经了售价为10万元的个人HPC,它省电、便宜、好用,像PC一样。

在历军看来,国产高性能计算机厂商与国外巨头们真正争夺的是中端应用市场,因此大型计算机的普及化是曙光看中的方向。他认为,要把研发像曙光5000这样大系统带来的一系列技术,真正应用到各个应用领域中去,才能满足众多行业客户对高性能计算的需求。

应该说,曙光的发展思路是三箭齐发,不断拓展高性能计算机的应用范围,在完成国家科研项目的同时,也使企业得到了发展的动力。

未来多用国产CPU 刀片技术是方向

让历军感到遗憾的是,尽管曙光5000部分采用了国产龙芯处理器,但国外的、通用的高性能处理器还是占了很大比重。不过让他感到欣慰的是,曙光5000不仅能够支持Linux、Unix等操作系统,还能支持微软的WCCS、Sun的Solaris。

历军表示,曙光高性能计算机未来将会越来越多地采用国产的处理器,以保证国家战略装备的安全。

谈及高性能计算机未来发展,他认为,刀片技术将会更为广泛地应用。

功耗是困扰高性能计算机发展的问题。历军表示,刀片服务器从设计看,在功耗管理方面采用了大量的技术,虽然本身不省电,但可以用外部手段使能效比更好。他认为,在某一个应用领域大显身手的专用机性能会非常高,而功耗则会有所降低。

高性能计算机随着性能是数量级增长,它的占地面积已逐渐不能被客户接受了,所以采取刀片高密度的组装是服务器厂商要考虑的重要问题。历军介绍说,从目前看,曙光5000的体积和曙光4000几乎相当,没有因为性能提高20倍就占更大的地方。

高性能计算机发展到今天,规模之大、复杂度之高,已经达到了以前很难想象的一种状态了。高性能计算机的可靠性从来都是需要重点研究的问题,曙光5000内部大约有7000个左右处理器,实际上就是28000个处理器核规模的机器,有1700片刀片。如果不采用刀片的方案,还是用过去的计算部件通过电缆连接的方式,几乎不可行了,可靠性完全不能保证。

链 接

“三高一低” 的曙光5000

1.高性能――超高运算速度

曙光5000的运算速度将超过百万亿次(设计性能230万亿次,交付使用200万亿次),Linpack值将达到160万亿次。

2.高效能――超高系统效率

曙光5000的系统使用效率将达到70%以上,Linpack值将达到160万亿次,计算节点16核SMP,胖节点达到32核SMP,单核心可用内存高达128G, 实现了单节点内的多路并行。

3.高密度――单节点4路16核刀片

曙光5000首次采用了4路16核的高密度刀片系统,首次采用了单机箱40颗CPU的高密度机箱设计,这些设计也成就了曙光5000最高密度高性能计算机的称号。

4.低功耗――230万亿次峰值功率700kW

曙光5000由于采用了超高密度的刀片服务器作为计算节点,采用了先进的水冷散热系统,在峰值运算时,耗电量控制在超低的700kW,而机房内的空调系统不用承担更多的负担。

上一篇:云计算的三大问题和两个瓶颈 下一篇:地震灾区IT市场遭受损失 英特尔渠道援助计划加...