高性能计算机体系结构综述

时间:2022-10-18 09:27:18

高性能计算机体系结构综述

摘要:本文回顾了自20世纪60年代至今的高性能计算机技术的发展历史,根据TOP500数据分析了各国高性能计算技术目前的发展情况,包括高性能计算机目前比较流行的体系结构技术;并根据目前的技发展状况,尝试说明高性能计算机的发展趋势。

关键词:高性能计算机;体系结构;集群;互联技术

中图分类号:TP3 文献标识码:A文章编号:1007-9599 (2010) 15-0000-02

Review of High Performance Computer System Structure

Tang Shaoyu

(China Petroleum&Chemical Corporation Catalyst Fushun Branch,Fushun113122,China)

Abstract:This paper reviews the developments of high performance compute architecture from the 1960s.According to TOP500 data,introduces the recent developments about high performance computer technique of various countries including the popular architecture technology.And according to the recent developments condition,try to forecast developmental tendency of high performance compute architecture in the future.

Keywords:High performance computer;Architecture;Cluster;

Interconnect technology

高性能计算机传统上指的是运行速度非常快的计算机,等同于超级计算机,致力于专业用户进行大规模科学和工程计算,追求的性能指标是浮点计算能力。随着对于高性能计算的应用需求由CPU运算密集型的科学和工程计算拓展到I/O处理密集型的商业事务处理,高性能计算机从单纯追求CPU运算能力变为追求包括I/O处理能力在内的综合性能指标,而且随着用户群体的扩大、对价格的日趋敏感以及PC服务器和互连网络等技术的成熟,高性能计算机已经倾向走产业化发展道路,采用开放的软硬件技术[1]。

当前,以机群为载体的高性能计算机已广泛应用于教育、游戏、气象、石油、航空航天、金融、生物、制造、信息建设等各个领域。高性能计算机应用的深度和广度在急剧提高。在深度方面,如北京2008年奥运气象预报要求分辨率从15公里提升到3公里;在广度方面,原来不需要HPC的领域,如政府、企业、诸多行业信息中心,由于信息处理量和访问量剧增,没有高性能计算机已无法完成信息整合和处理能力的提升。机群技术的日益普及已经深刻影响了高性能计算产业的发展,并推动全球高性能计算产业进人一个平民化应用时代,我们也称之为“泛高性能计算时代”[2]。

一、高性能计算机历史回顾

最早的电子计箅机就是为了能够进行大量繁琐的科学计算而产生的。从1960年开始,计算机技术逐渐成熟,在各种商业领域慢慢地开始采用电子计算机,而且应用范围也越来越广,逐渐出现了针对各种不同商业用途的计算机,被称为“通用计算机”。相对于“通用计算机”,具有性能和功能上的优势的一类计算机被称为“高性能计算机”,在当时主要用于科学计算。

20世纪70年代出现的向量计算机可以看作是第一代的高性能计算机。通过在计算机中加入向量流水部件,可以大大提高科学计算中向量运算的速度。到80年代,出现了并行向量多处理机(PVP),依靠并行处理,进一步提高运算速度。向量机成为当时高性能计算机的主流产品,占领了高性能计算机90%的市场。

20世纪90年代初期,大规模并行处理(massively parallel processor,MPP)系统开始成为高性能计算机发展的主流。MPP模式是一种分布式存储器模式,能够将更多的处理器纳入一个系统的存储器。MPP体系结构对硬件开发商颇具吸引力,因为它们出现的问题比较容易解决,开发成本比较低。由于没有硬件支持共享内存或高速缓存一致性的问题,所以比较容易实现大量处理器的连接。

较MPP早几年问世的对称多处理机SMP系统,是由数目相对较少的微处理器共享物理内存和I/O总线形成的计算机系统(国内最早基于微处理器的SMP为曙光1号)和MPP相比,早期的SMP扩展能力有限,并不具有很强的计算能力。但由于SMP与单机系统兼容性好,是单机系统的升级与增强,被广泛应用于商业计算领域。

20世纪90年代中后期的一种趋势是将对称多处理器结构(Symmetric Multi-Processor,SMP)的优点和MPP的扩展能力结合起来,这一趋势发展成后来的CC―NUMA结构,即分布式共享内存。每个处理器节点都可以访问到所有其它节点的内存,但访问远程内存需要的延迟相对较大。NUMA本身没有在提高性能的角度上进行较大的创新,主要优点是便于程序的开发和与SMP的兼容性。而对于科学计算任务,CC―NUMA结构是否优于MPP系统仍存在争议。

在发展CC―NUMA的同时,集群系统(cluster)也迅速发展起来。类似MPP结构,集群系统是由多个微处理器构成的计算机节点,通过高速网络互连而成。节点一般是可以单独运行的商品化计算机[3]。由于规模经济成本低的原因,集群系统具有比MPP更高的性能/价格比优势。集群系统还继承MPP系统的编程模型,更进一步地加强了其竞争优势[4]。

二、高性能计算机技术发展现状

当前,全球TOP500已经成为高性能计算领域的晴雨表[5]。第35届全球超级计算机TOP500排行榜于2010年5月31日在德国汉堡举行的SC10大会上。排名第一的仍是美国Cray公司研制的“美洲豹”系统;中国曙光公司制造的“星云”超级计算机以1.27Pflops的Linpack性能和2.98Pflops的峰值性能排名第二,此次成绩可谓曙光高性能计算机突破历史的最好成绩,也是我国高性能计算机的历史最好成绩。在TOP10系统中,IBM公司占有4台(一台“走鹃”和三台“蓝色基因”),Cray公司拥有2台(“美洲豹”和“海怪”),SGI、Sun以及中国的曙光公司和国防科技大学各占有一台。但我国所制造两台系统(“星云”和“天河”)的核心部件CPU和GPU仍是源自美国的Intel、AMD以及NVIDIA公司。由此可见,美国在高性能计算领域的综合技术实力是无可比拟的。

(一)体系架构

从大的体系结构来看,TOP10系统分为两种:MPP(大规模并行处理)和Cluster(集群)。其中,采用MPP结构的系统有6台――Cray“美洲豹”和“海怪”、三台IBM蓝色基因机器、SGI“昴宿星”;采用Cluster结构的机器有4台――曙光“星云”、IBM“走鹃”、国防科大“天河”、Sun“红色天空”。

MPP结构的系统又分为基于高性能通用多核CPU(Cray、SGI系统)和基于低功耗嵌入式CPU(IBM蓝色基因系统)。

上一篇:任务驱动在非实践工程类课程教学中的应用 下一篇:P2P网络结构及应用前景研究