内容简介

"本书聚焦通用并行计算GPGPU 技术及其实践,系统回顾GPU 从图形渲染到通用计算的演化历程,深入解析GPU指令集、微架构、软件工具链设计。本书分为4 部分:第 1 部分回顾GPGPU的时代背景与发展历程,介绍主要开源项目;第2 部分探讨GPU设计思想与指令集,并引出乘影GPGPU自定义指令集;第3 部分剖析乘影GPGPU硬件微架构,包括流式多处理器单元、CTA调度器、缓存子系统、内存管理单元以及张量计算系统等关键模块;第4 部分介绍基于OpenCL的编程模型、LLVM 编译器及驱动工具链,构建完整的GPGPU软件生态。本书兼顾理论与实操,既涵盖GPU并行计算的核心原理与关键技术,又结合乘影开源项目的实践示例,帮助读者深入理解并掌握现代GPGPU的设计与实现路径。

本书适合对GPU 架构、并行计算与开源硬件生态感兴趣的工程师、学生和研究人员阅读。

"