GPU编程与优化——大众高性能计算
让普通程序员通晓GPU编程,让高性能计算不再高不可攀。 提供课件,咨询QQ:2301891038(仅限教师)。

作者:方民权 张卫民 方建滨 周海芳 高畅

定价:59元

印次:1-6

ISBN:9787302446422

出版日期:2016.09.01

印刷日期:2025.01.21

图书责编:杨帆

图书分类:零售

电子书
在线购买
分享
内容简介
作者简介
前言序言
资源下载
查看详情 查看详情 查看详情

本书第一篇系统地介绍GPU编程的相关知识,帮助读者快速入门,并构建GPU知识体系;第二篇和第三篇给出大量实例,对每个实例进行循序渐进的并行和优化实践,为读者提供GPU编程和优化参考;第四篇总结影响GPU性能的关键要素(执行核心和存储体系),量化测评GPU的核心性能参数,给出CPU/GPU异构系统上覆盖完全的各种混合并行模式及其实践,帮助读者真正透彻理解GPU。 本书适合作为计算机及相关专业的教材,也可作为GPU程序开发人员和科研人员的参考书。本书封面贴有清华大学出版社防伪标签,无标签者不得销售。

方民权国防科学技术大学计算机科学与技术专业博士,研究方向是高性能计算、异构计算,涉及领域包括遥感图像处理、计算微电子学、声呐信号处理和地震模拟等。 张卫民博士,研究员,博士生导师,任国防科学技术大学海洋科学与工程研究院总工程师、湖南省气象协会副理事长、湖南省计算数学协会理事,研究方向是数值天气预报、海洋环境数值模拟、卫星资料、并行算法,科研成果获部委级一等奖7项、二等奖8项、三等奖1项,出版著作5部,发表论文80余篇。

前言 多核与众核异构平台因其超强的浮点运算能力而成为当前高性能计算领域的新贵。2010年以来,已有3台异构超级计算机夺魁TOP 500,分别是搭载CPU/GPU异构系统的天河1A和泰坦超级计算机、搭载CPU/MIC异构系统的天河2号超级计算机。在这两类主流的多核与众核异构平台中,CPU/GPU异构平台在性价比、能耗比等方面表现尤为突出,例如,在Green500前10中有9台采用了这种架构。对于高性能计算用户而言,CPU/GPU异构系统无疑是一个良好的选择。 另一方面,当前PC已普遍装备GPU(独立显卡),使得这种CPU/GPU异构系统的硬件平台随处可见。尽管这类平台的GPU工作重心是游戏娱乐而非浮点计算,但在一些精度要求不高的领域仍然优势显著。此外,基于GPU编程的工具包是免费的,因此可用较低的成本构建合适的CPU/GPU异构并行平台。由于显卡的普及,CPU/GPU异构并行程序也能在几乎所有的PC中广泛应用。 然而,仅有硬件是没有应用价值的,异构系统上的程序开发是实现异构系统价值的直接且唯一的步骤。但是,异构并行软件开发面临着巨大挑战,主要包括异构数据通信、基于GPU体系结构的编程与优化、多编译器的联合编译等,具体到实践则难度更大。编写本书的目的就是辅助用户解决这些GPU异构并行软件开发的难题。 目前市面上已有很多GPU编程书籍,其中一些已经论述相当全面,为什么还要撰写本书呢?作为一名有多年开发经验的GPU程序员,阅读这些书籍总感觉有些不足。 首先,对于刚接触GPU的开发者,由于所要认识的GPU体系结构与常用的CPU体系结构差异巨大,相关的理论知识...

目录
荐语
查看详情 查看详情
目录

第一篇理论篇

第1章高性能计算概述3

1.1高性能计算概念辨析3

1.1.1并行计算、高性能计算和超级计算3

1.1.2超级计算机与超级计算中心4

1.2计算科学5

1.3高性能计算发展史5

1.4高性能计算简介6

1.5向量机与阵列机8

1.6本章小结9

第2章GPU概述10

2.1GPU是什么10

2.2协处理器10

2.3GPU与显卡的关系11

2.4GPU/显卡购买注意事项11

2.5为什么要学GPU编程12

2.6GPU与CPU辨析13

2.7GPU发展简史14

2.8GPU编程方法14

2.9CPU/GPU异构系统16

第3章GPU硬件架构17

3.1GPU架构17

3.1.1Tesla架构18

3.1.2Fermi架构20

3.1.3Kepler架构21

3.1.4Maxwell架构23

3.1.5Pascal架构243.2Kernel的硬件映射28

3.3GPU存储体系29

3.4GPU计算能力30

GPU编程与优化——大众高性能计算目录第4章GPU软件体系33

4.1GPU软件生态系统33

4.2CUDA Toolkit34

4.2.1NVCC编译器34

4.2.2cuobjdump35

4.3CUDA环境安装36

4.3.1Windows 7安装CUDA 4.236

4.3.2Linux下安装CUDA38

第5章CUDA C编程41

5.1CUDA编程模型41

5.2CUDA编程七步曲42

5.3驱动API与运行时API42

5.4CUDA运行时... 查看详情

系统全面的GPU知识体系

实践引导的有效优化方法

切中要害的性能影响因素

通俗翔实的异构协同并行

循序渐进的优化实例解析

精炼真实的GPU性能测评

查看详情