通用图形处理器指令集架构和软硬件设计——乘影开源GPGPU设计透视
GPGPU架构的深度实践指南,系统追溯技术演化,并依托开源项目,提供构建完整软硬件生态的宝贵实战经验。

作者:何虎、马鸣远、于芳菲

定价:129元

印次:1-1

ISBN:9787302705055

出版日期:2025.12.01

印刷日期:2025.12.17

图书责编:黄芝

图书分类:学术专著

电子书
在线购买
分享
内容简介
作者简介
前言序言
资源下载
查看详情 查看详情 查看详情

"本书聚焦通用并行计算GPGPU 技术及其实践,系统回顾GPU 从图形渲染到通用计算的演化历程,深入解析GPU指令集、微架构、软件工具链设计。本书分为4 部分:第 1 部分回顾GPGPU的时代背景与发展历程,介绍主要开源项目;第2 部分探讨GPU设计思想与指令集,并引出乘影GPGPU自定义指令集;第3 部分剖析乘影GPGPU硬件微架构,包括流式多处理器单元、CTA调度器、缓存子系统、内存管理单元以及张量计算系统等关键模块;第4 部分介绍基于OpenCL的编程模型、LLVM 编译器及驱动工具链,构建完整的GPGPU软件生态。本书兼顾理论与实操,既涵盖GPU并行计算的核心原理与关键技术,又结合乘影开源项目的实践示例,帮助读者深入理解并掌握现代GPGPU的设计与实现路径。 本书适合对GPU 架构、并行计算与开源硬件生态感兴趣的工程师、学生和研究人员阅读。 "

"何虎,上海清华国际创新中心副主任,清华大学集成电路学院副教授,博士生导师,清华大学工业与车规半导体芯片研究中心主任。主要研究方向是高性能处理器。在TCAD,TCAS、TVLSI,Frontiers in Neuroscience,MICRO等国际期刊和会议上发表多篇论文。曾获北京市科学技术奖一等奖等三项省部级奖励。出版《通用图形处理器指令集架构和软硬件设计》《车规级芯片技术》等专著。承担清华大学“超大规模集成电路CAD”和“大规模集成电路测试方法学”课程教学。马鸣远,清华大学集成电路学院博士研究生,本科毕业于清华大学物理系。曾获清华大学优良毕业生、北京市优秀毕业生等荣誉。于芳菲,清华大学集成电路学院硕士研究生,2022年获得学士学位,2025年获得硕士学位,专注于GPGPU指令集架构及硬件设计研究。目前就职于阿里巴巴达摩院。"

前言 自人类文明诞生以来,对算力的需求就从未停歇。从古希腊的算盘、阿拉伯数学家对代数的系统化,到莱布尼茨与牛顿为微积分而争锋,再到近代图灵、冯·诺依曼等先驱奠基的计算机理论,技术的不断迭代皆围绕一个核心目标:更高效率、更强大、更普惠的计算能力。我们身处的信息时代,数据与计算需求正以指数级增长:从庞大的科学计算、高性能计算(HPC),到人工智能、大数据,再到实时渲染和元宇宙应用,一个个应用场景的浮现,都将“通用且强大的并行计算”推向了时代舞台的中央。 在过去的数十年间,图形处理器(GPU)经历了从固定功能管线到可编程着色器,再到GPGPU(通用GPU)时代的演变,充分展现了并行计算的巨大潜力。回顾20世纪末,GPU尚被视为专业的图形加速硬件,主要用于游戏、图形渲染以及CAD等领域。随着程序员和研究者对可编程着色单元的不断挖掘,尤其是Shader Model的演进,人们逐渐意识到:GPU不只能绘图,其强大的多核并行结构同样可被用来加速通用计算。自2006年前后CUDA、OpenCL等编程生态的兴起,GPU的通用计算价值被全面释放,无数科学研究、机器学习、数据分析工作开始从传统CPU平台迁移或部分迁移至GPU平台,性能呈现数量级的提升,成为当之无愧的并行计算基石。 然而,主流GPU架构与软件栈常被少数厂商主导,GPU的核心指令集架构、硬件实现细节等关键技术信息通常在专利和商业机密保护下,难以被公开探究。对于学术研究者、开源爱好者、初创企业等群体而言,难以从头完整地了解GPU内在原理与软硬件的协同设计。于是,开源GPU项目应运而生。在全球范围内,部分高校实验室、开源社区以及行业先...

目录
荐语
查看详情 查看详情
目录

第1部分 背景与概览/ 1

第1章 行业背景和发展/ 2

1.1 GPGPU的历史与发展/ 2

1.1.1 早期计算机图形的发展/ 2

1.1.2 专用图形处理器的诞生/ 7

1.2 GPU的可编程化与GPGPU的萌芽/ 11

1.2.1 可编程着色器时代(2001—2006年)/ 11

1.2.2 通用计算需求的增长/ 12

1.3 GPGPU通用计算时代的兴起(2006年起)/ 14

1.3.1 统一渲染架构的引入/ 14

1.3.2 CUDA的推出与影响/ 14

1.3.3 OpenCL的出现与标准化/ 15

1.3.4 计算着色器的引入与GPGPU的成熟/ 16

1.4 光线追踪与AI时代/ 16

1.4.1 光线追踪的崛起:从离线到实时/ 16

1.4.2 AI驱动的GPU变革/ 17

1.5 GPU的未来:架构演化与技术创新/ 17

1.5.1 硬件架构的持续演化/ 17

1.5.2 网格着色器/ 18

1.5.3 封装和互连技术的演进/ 18

1.5.4 GPGPU技术的挑战/ 21

1.6 本章小结/ 22

第2章 开源项目与开发进展/ 23

2.1 主要开源GPGPU项目概览/ 23

2.1.1 OpenVGA/ 23

2.1.2 Nyuzi Processor(2012)/ 24

2.1.3 MIAOW(2015)/ 25

2.1.4 FGPU:An SIMT-Architecture for FPGAs(2016)/ 26

2.1.5 Vortex(2019)/ 27

2.1.6 乘影G... 查看详情

"这是一部全景式解析开源GPGPU设计的力作,旨在打通从理论原理到项目实践的全链路。

贯穿全栈,视野宏大

从GPU发展史、指令集设计、微架构剖析,到OpenCL编程模型与LLVM编译器工具链,提供一站式GPGPU知识体系。

硬核剖析,深入细节

立足“乘影”开源项目,对流式多处理器(SM)、缓存子系统、内存管理单元(MMU)及Tensor Core等关键模块进行深度解读。

实践导向,资源完备

本书不仅是理论指南,更是实战手册,提供全栈开源代码与全流程实操指南,助力读者将知识转化为技能。

生态完整,工具先进

详解基于OpenCL与LLVM的现代GPGPU软件栈,涵盖编程、编译、驱动等核心环节,构建完整的开发与运行环境。

本书为渴望掌握通用并行计算核心技术的工程师、研究者和学生,点亮了“从零到一”设计和实现GPGPU的完整路径。"


查看详情