基于图形处理单元的数值计算

时间:2022-09-25 09:26:46

基于图形处理单元的数值计算

随着科技的迅猛发展,越来越多的人意识到机器的计算能力在现代科学发展过程中举足轻重的影响力。现如今各领域的工程师也不遗余力地优化各自的计算模型和工具,从而让项目的计算性能得到进一步提升。而近年来,随着图形处理单元(GPU,Graph Processing Unit)的发展日益成熟,其应用的范围已从最初的计算机图形学领域,逐步扩展到数值计算领域。与传统的CPU相比,GPU在计算能力方面有着巨大的优势。本书主要关注GPU中数值方法的实现,着重介绍了目前GPU在数值计算领域的发展以及相关原理和方法,

全书共18章,分为4个部分,每部分都包含了一些典型的数值计算方法。第1部分 线性代数问题求解,包括第1-6章:1.基于GPU结构的稠密线性代数计算;2.基于GPU结构的三对角计算;3.矩阵计算,介绍LAPACK、GEMM以及MKL等高性能的线性代数计算库;4.LU和QR分解,介绍GPU编程中批量分解算法;5.线性系统下基于LU分解的CUDA算法,着重阐述小矩阵计算中批量线性求解方法的CUDA实现;6.矩阵向量乘积,着重介绍如何用GPU高效地实现科学计算中经典的稀疏矩阵与向量乘积(SpMV)算法。第2部分 介绍微分方程的空间离散化,包括第7-11章:7.GPU常微分方程的求解;8.GPU并行集成,介绍GPU中线程级并行算法的实现;9.介绍谱元法在非结构网格流动和波动问题中的应用;10. 利用局部修正SOR方法求解对流扩散问题;11.CUDA及OpenCL编程中的有限差问题。第3部分 随机数和蒙特卡洛方法,包括第12-15章:12.GPU伪随机数生成,介绍蒙特卡洛仿真算法在OpenCL下的编程实现;13.蒙特卡洛自动化积分,介绍CUDA编程中动态的并行计算问题;14. GPU加速计算实例:量子轨迹法;15.GPU动态系统中的蒙特卡洛仿真,介绍数值积分并给出蒙特卡洛方法的应用实例。第4部分 快速傅里叶变换以及N体问题,包括第16-18章:16.快速傅里叶变换(FFT)在GPU下的编程实现;17.介绍一种共享内存复用方法,在此基础上实现高效快速的傅里叶变换;18.N体问题仿真算法在GPU中的实现,探讨在增加并行性的同时如何减少对线程等系统资源的抢占问题。

本书内容丰富,而且特别注重实际应用,可作为GPU以及CUDA的学习和编程参考书。对从事高性能计算相关学科学习的高年级大学生、研究生和相关领域的研究人员,本书极具参考价值。本书要求读者有一定的线性代数、微分方程等数学功底且具有扎实的C或C++语言编程基础。

上一篇:论英语报刊阅读中学生思辨能力的培养 下一篇:加强区域协作 打造优质教师队伍 推进教育均衡...