





定价:79元
印次:1-1
ISBN:9787302684169
出版日期:2025.04.01
印刷日期:2025.04.18
图书责编:赵佳霓
图书分类:零售
"本书以实战项目为主线,以理论基础为核心,引导读者渐进式地学习Transformer模型。 本书分为5篇共17章。Transformer模型基础篇(第1~5章)重点介绍Transformer模型框架。把Transformer模型掰开,从最基础的输入出发,按照模型框架,一点一点走进Transformer模型的内部,直到最终的模型输出;Transformer模型NLP领域篇(第6章和第7章)重点介绍Transformer模型在自然领域中的应用,了解ChatGPT的往事今生;Transformer模型计算机视觉篇(第8~10章)重点介绍Transformer模型在计算机视觉任务中的应用,让Transformer模型可以看到真实的世界;Transformer模型进阶篇(第11~13章)重点介绍Transformer模型在多模态领域上的应用,以及与其他模型的混合模型;Transformer模型实战篇(第14~17章)从环境搭建到NLP领域,计算机视觉领域,音频领域等的代码实战,彻底讲解Transformer模型的运行机制。 本书的每个章节、每个知识点都有对应的代码解析与精美图片展示,让读者能够更加容易理解Transformer模型的各个核心知识点。 本书既适合初学者入门,精心设计的案例对于工作多年的开发者也有参考价值,并可作为高等院校和培训机构相关专业的教学参考书。 "
李瑞涛,副高级工程师,武汉理工大学硕士,长期从事智能硬件与软件产品的研究开发工作。自媒体创作者,期坚持撰写人工智能领域技术博客。在各大媒体平台开设人工智能领域视频课程,受广大网友⼀致好评。
前言 人工智能从广义上来讲,凡是不涉及人类参与的动作或者行为都可以称为“人工智能”。在人工智能初期发展阶段,研究人员试图通过设定复杂的规则与逻辑模拟人类的思维过程,让真正的“人工智能”从科幻小说走进现实生活,但是随着研究的深入,研究人员发现无法通过简单的规则与逻辑来应对现实世界复杂与多变的环境。 20世纪80年代,随着机器学习的兴起,标志着人工智能进入了新的阶段。机器学习强调从数据中学习规律,通过对大量的数据进行训练,机器学习算法可以自动地构建模型,用于预测或决策。机器学习方法显著地提高了人工智能系统的灵活性与适用性,但是机器学习需要人类将大量的数据标注给人工智能模型,让模型去学习所有数据特征,例如如果想让模型识别出一个苹果,就需告诉模型苹果都有哪些特征,符合这些特征的水果便是苹果。机器学习在特征数据搜集上浪费了大量时间。 深度学习的突破引发了人工智能领域又一轮的技术革命。深度学习模仿人类大脑,利用多层的神经网络,能够自动提取数据中的特征,显著地提高了模型的自动识别能力。特别是在图像识别、语音识别和自然语言处理任务上,深度学习取得了显著的成绩,例如让模型同样识别一个苹果,那么就直接告诉模型,这就是一个苹果,其所有的苹果特征由模型的神经网络自动识别提取,大大地提高了模型的表现能力。卷积神经网络与循环神经网络模型作为深度学习的两大代表,分别在图像识别与自然语言处理任务上表现出了强大的能力。 2023年,ChatGPT(智能对话聊天机器人)的流行,让人工智能走进了大众的视野。一直以来人工智能主要是技术专家涉及的领域,但是ChatGPT打破了技术壁垒,让...
本书源码
Transformer模型基础篇
第1章Transformer综述
1.1Transformer是什么
1.1.1Transformer模型的工作原理
1.1.2Transformer模型的编码器与解码器简介
1.1.3Transformer模型编码器层
1.1.4Transformer模型解码器层
1.1.5Transformer模型残差连接与数据归一化
1.2Transformer模型框架
1.2.1Transformer模型的词嵌入
1.2.2Transformer模型的位置编码
1.2.3Transformer模型的编码器与解码器
1.2.4Transformer模型的最终输出
1.2.5Transformer模型的注意力机制
1.2.6Transformer模型的多头注意力机制
1.2.7Transformer模型的前馈神经网络
1.3本章总结
第2章Transformer模型的输入与输出
2.1Transformer模型的词嵌入
2.1.1Transformer 模型词嵌入的概念
2.1.2Transformer模型词嵌入的代码实现
2.2Transformer 模型的位置编码
2.2.1Transformer 模型位置编码的计算过程
2.2.2Transformer模型位置编码的正余弦函数
2.2.3Transformer 模型位置编码的代码实现
2.3Transformer模型解码器的输...
■易教易学 系统阐述理论的同时,结合图片展示与代码解析,既为初学者提供容易入门的基础理论,也为广大人工智能领域的学生及研究者提供全面的案例。
■前后衔接 强调知识体系和分析方法的前后连贯性,并妥善处理好内容的衔接性。
■技术前沿 介绍Transformer模型基础理论及Transformer模型的优化模型,并介绍其变体模型(GPT、MoE等)在人工智能领域的新进展。激发读者的学习兴趣,启迪创新思想。
"