清华大学出版社--图书详情

+教师申领样书

首页 > 图书 > 图书详情

大模型核心技术与开发实践：基于Transformer、PyTorch及Hugging Face

从注意力机制到企业级部署，解码大模型开发的每一个关键节点！

作者：凌峰

定价：99元

印次：1-1

ISBN：9787302691402

出版日期：2025.06.01

印刷日期：2025.05.23

图书责编：王金柱

图书分类：零售

电子书

在线购买

京东天猫电子书

内容简介

作者简介

前言序言

资源下载

查看详情查看详情查看详情

"《大模型核心技术与开发实践：基于Transformer、PyTorch及Hugging Face》系统地介绍大语言模型（LLM）的理论基础、实现方法及在多种场景中的应用实践。共分为12章，第1~3章介绍Transformer模型的基本架构与核心概念，包括编解码器的结构、自注意力机制、多头注意力的设计和工作原理；第4~6章结合实际案例，讲解如何利用PyTorch和Hugging Face库构建、训练和微调LLM；第7~9章介绍生成模型的推理和优化技术，包括量化、剪技、多GPU并行处理、混合精度训练等，以提高模型在大规模数据集上的训练和推理效率；第10、11章通过实例讲解Transformer在实际NLP任务中的应用以及模型可解释性技术；第12章通过一个企业级文本分析平台项目的搭建，介绍从数据预处理、文本生成、高级分析到容器化与云端部署的完整流程，并提供了代码示例、模块化测试和性能评估方法，帮助读者实际构建满足企业需求的智能应用系统。《大模型核心技术与开发实践：基于Transformer、PyTorch及Hugging Face》覆盖了当前广泛关注的LLM技术热点，并提供了丰富的实例代码，适合大模型开发人员、大模型应用工程师、算法工程师以及计算机专业的学生，亦可作为高校人工智能课程的相关教学用书。"

凌峰，博士，目前就职于某985高校，长期从事机器学习、人工智能、计算机视觉与大模型领域的研发与教学，在模型优化、训练加速、数据驱动算法开发等方面有深刻见解，参与并主导多项相关科研项目。

前言随着大模型技术的飞速发展，特别是以Transformer为核心的深度学习架构在自然语言处理（NLP）领域的广泛应用，企业对大语言模型（LLM）的需求日益增长。LLM在文本生成、分类、问答等任务上展现出强大的潜力，能够深入理解和生成自然语言内容，为数据分析和业务决策提供了强有力的技术支撑。基于LLM的应用不仅提升了业务的自动化和智能化水平，还为企业在数据驱动的商业环境中提供了竞争优势。本书系统地介绍了Transformer模型的核心结构与实现，包括自注意力机制、多头注意力、残差连接等关键技术，并介绍了如何利用PyTorch和Hugging Face库构建、训练和微调LLM，帮助读者掌握LLM的关键技术与应用方法。书中还专门介绍了多GPU并行处理、混合精度训练等技术，以提高模型在大规模数据集上的训练和推理效率，为实时分析与智能决策提供有力支持。在上述内容的基础上，本书还介绍了Transformer在实际NLP任务中的应用、模型可解释性技术以及项目实战等内容。在结构安排上，本书分为12章，内容由浅入深，各章内容概要如下：第1~3章 Transformer与PyTorch基础该部分内容详细讲解了Transformer的基本架构与核心概念，包括编码器－解码器结构、自注意力机制和多头注意力的设计与工作原理，帮助读者深入理解和实现Transformer模型的组成部分。同时，还提供了在PyTorch中实现基础Transformer模型的代码示例，使读者掌握模型搭建的基础知识。第4~6章模型构建与微调这一部分内容介绍了如何在实际项目中使用Hugging ...

课件下载

样章下载

暂无网络资源

版权信息

扫描二维码
下载APP了解更多

荐语

查看详情查看详情

第 1 章 Transformer与PyTorch的集成应用概述 1

1.1 大模型与Transformer的技术背景 1

1.1.1 自注意力机制的原理与实现细节 2

1.1.2 多层堆叠与残差连接：Transformer的高效信息流 4

1.2 PyTorch的应用场景与技术特点 7

1.2.1 动态图计算与自动微分机制 7

1.2.2 GPU加速与多设备支持 8

1.3 快速上手：使用PyTorch实现一个简单的Transformer模型 12

1.3.1 Transformer编码器的基础实现与训练流程 13

1.3.2 解码器与完整Transformer模型的拼接与测试 16

1.4 本章小结 21

1.5 思考题 21

第 2 章 Transformer编码器与解码器的原理与实现 22

2.1 Transformer编码器与解码器结构分析 22

2.1.1 位置编码的设计与实现 23

2.1.2 多头注意力与前馈层的层次关系 28

2.2 基于PyTorch实现编码器－解码器架构 31

2.2.1 多头注意力模块的独立实现与测试 32

2.2.2 残差连接与层归一化的模块化实现 34

2.3 Transformer的编码解码过程 36

2.3.1 编码器多层堆叠与信息流动的实现 36

2.3.2 解码器自回归生成过程的实现与可视化 39

2.3.3 基于文本的Transformer实例：逐步打印编码解码过程 42

2.4 编码器和解码器的双向训练流程 45 ... 查看详情

"《大模型核心技术与开发实践：基于Transformer、PyTorch与Hugging Face》一书以Transformer模型为核心，系统讲解其架构设计与实现原理，并结合PyTorch和Hugging Face库深入剖析大模型开发全流程。全书内容由浅入深，讲解通俗易懂，涵盖理论知识与应用实践，共12章，具体介绍如下：
第1-3章从Transformer编码器-解码器结构、自注意力机制等核心原理入手，配合PyTorch代码示例，帮助读者夯实模型搭建基础；
第4-6章聚焦预训练模型的加载、微调与迁移学习，结合NLP任务的数据预处理、分词技术等实战环节，为模型优化提供方法论；
第7-9章覆盖文本生成、模型量化、分布式训练等高级主题，通过Beam Search、Top-K采样等技术解析生成模型控制逻辑，并深入多GPU并行、混合精度训练等性能优化方案。
第11章可解释性分析，借助SHAP、LIME等工具拆解模型决策逻辑，助力企业级应用可信度提升。
第12章通过智能文本分析平台综合项目，串联数据预处理、模型训练、部署优化等全链路环节，强化工程实践能力。
《大模型核心技术与开发实践：基于Transformer、PyTorch及Hugging Face》注重理论与实践结合，代码示例详实，涵盖从模型调优到云端部署的完整开发周期，适合大模型开发者、算法工程师、NLP工程师及高校师生作为技术手册与实战指南。"

查看详情

关于我们

新闻资讯

服务支持

关于我们

新闻资讯

服务支持