如何应对并行加速器应用来袭

时间:2022-06-30 05:14:31

如何应对并行加速器应用来袭

近年来,虽然Intel和AMD的CPU架构有了翻天覆地的变化,但产品综合性能提升并不明显,单核心CPU仅依靠新工艺带来的大缓存、高频率来获得的性能提升效率已接近极限,而多核心CPU由于存储机制和内存带宽的限制,应用效率也遭遇瓶颈,可以看出传统的计算架构必须作出修改。与此同时,可编程的GPU及MIC通用计算架构逐步成熟,它们在高效并行计算、应用成本、扩展性、能效等方面表现出的突出优点,使其越来越受到用户关注。

目前,并行加速器主要包括两大类,一种是来自NVIDIA和AMD的GPU并行加速处理器,另一种则是来自Intel的MIC众核架构Xeon Phi融核协处理器。由于图形处理器GPU及融核协处理器的并行计算能力的快速发展和其可编程能力的不断提高,目前,通过“CPU+GPU”或“CPU+MIC”异构协同计算架构,可以将CPU从繁重的大规模并行计算任务中解放出来,由GPU并行加速器或MIC融核协处理器代为处理,利用加速器强大的并行计算处理能力和高带宽,弥补CPU的性能不足。天河一号、天河二号的成功研制,不仅标志着我国超级计算机技术进入国际先进行列,同时也证明“CPU+GPU”和“CPU+MIC”异构并行计算在大规模计算中的可行性。

面向计算密集型用户,如航空航天装备研制、卫星遥感数据处理、气象预报、海洋环境数值模拟等领域,并行加速器能很好地满足它们对较高浮点运算能力的要求。同样,并行加速器也适用于金融、证券、交通、邮政、电信、能源等领域对服务器性能、可扩展性及可靠性要求苛刻的企业级应用环境。当前最热的大数据处理,诸如搜索引擎、社交网络等用户巨量资料检索、交互需要高性能运算处理能力,并行加速器的处理特性就能很好地满足这种“高密集运算量+较低个体任务负载”的大数据处理要求。另外,将GPU融入到云计算底层架构中,打造“CPU+GPU”或“CPU+MIC”异构运算系统,可以实现CPU和GPU计算资源的合理分配,也会大大降低云服务成本。

目前,中国并行加速器计算应用市场才刚刚起步,并行加速器应用中科研性的应用比较多,生产性的应用比较少,主要原因是并行加速器应用研发与生产性的应用脱节,使得并行加速器的经济效益难以体现,很难形成研发的应用良性循环。另外一个非常重要的原因还是各个企事业单位缺乏应用型人才。要推动生产性并行加速器应用的普及与发展,有必要构建产学研用互动机制,将产品与技术的研发与行业实际应用紧密结合,充分利用并行加速器的优势,进一步拓展计算的应用范围。同时,通过用户对并行加速器应用中出现的具体问题加速和优化并行加速器的技术与应用创新,从而使并行加速计算具备更好的实用性,能够为更多行业用户接受和认可。

并行加速器的广泛应用依赖于对并行算法、编程效率、系统扩展性等技术的采纳,并行加速器在并行计算、编程效率、大规模计算性能上的难题也需要有专业的人才来解决。现阶段,中国专业并行计算人才仍然存在较大的缺口,需要积极推进并行计算人才培养计划:一方面,企业要加大与科研院校的合作,在师资力量的培养、课程教育方面提供更多支持;高校需加强并行加速器相关专业课程的建设,以市场人才需求为导向,优化学科专业,培养更多并行加速器领域适应性人才。另外,还要大力扶持并行加速器行业应用典型。

上一篇:精细管理 服务群众 下一篇:用TDA破解威胁侦测难题