


定价:89元
印次:1-1
ISBN:9787302704386
出版日期:2025.12.01
印刷日期:2025.12.24
图书责编:杨帆
图书分类:教材
"大模型技术正处于人工智能领域的前沿。随着模型规模的扩大,技术复杂性和资源需求急剧增加,如何优化性能、提升效率并应对相关挑战,成为当前研究的核心问题。本书深入解析大模型的基础、优化方法及复杂任务适应,全面展示其前沿技术和应用潜力。全书分为“大模型基础”“大模型优化方法”“大模型能力扩展”三部分,逐步深入地介绍了大模型的核心技术和前沿发展。第一部分“大模型基础”作为基础篇,注重理论铺垫;第二部分“大模型优化方法”作为进阶篇,深入技术细节;第三部分“大模型能力扩展”作为高级篇,聚焦前沿挑战。 本书适合作为高等院校非计算机专业本科生、计算机相关专业本科生及研究生的教材。无论是通识课程还是专业课程,均能提供从入门到深入的全面知识支持。 "
前言 生成式人工智能(Generative AI)是当今人工智能领域的核心技术之一,近年来得到了广泛关注和迅猛发展。从文本生成、图像创作到音频合成,生成式模型不仅在学术界取得了重要突破,也在产业界引发了变革。特别是以深度学习为基础的模型,如ChatGPT、Mamba等,已在自然语言处理、计算机视觉等多个领域取得显著成果,推动了智能问答、自动写作、虚拟助手、创意设计等实际应用的发展。 本书的编写,始于我们对当前大模型技术和人工智能领域快速发展的关注。生成式人工智能作为推动技术进步的核心力量,在学术界和产业界引起了广泛的讨论和应用。从自然语言处理、图像处理到跨模态系统的构建,大模型技术已经在多个领域展现出巨大潜力。同时,作为走向通用人工智能的关键技术,众多国内外研究者投身于大模型相关技术研究: 一方面使该技术领域的研究呈现蓬勃发展的状态,对应领域的研究深度、研究广度不断拓展;而另一方面也使得该技术领域的从业门槛大幅提升。高校作为高层次人才培养的主体,需要为国家培养该领域的专业人才。为此,迫切需要一本可以作为计算机相关专业本科生及研究生的生成式人工智能类专业教材,这是本书编写的重要目标。 本书的编写始于2024年4月,经过数月的资料收集和教材内容规划,至2024年9月初步确定了框架和主要内容,并于2024年10月正式启动写作。这一过程中,研究小组有超过20位师生参与,是我们研究小组迄今为止投入人数最多、持续时间最长的一项集体科研活动。力求通过清晰的结构,使不同背景的读者能够深入理解生成式人工智能的核心技术及其发展趋势。 王兴伟教授领导了本书的编写工作,确定了编写的总体...
第一部分大模型基础
第1章预训练语言模型基础概述3
1.1Transformer简介3
1.1.1Transformer架构3
1.1.2关键技术4
1.1.3作用与影响6
1.2预训练语言模型概述7
1.2.1基于Transformer的模型架构7
1.2.2BERT模型8
1.2.3GPT系列模型9
1.2.4BART模型12
1.2.53种模型对比13
1.3总结与习题15
1.3.1本章总结15
1.3.2本章习题15
第2章大模型架构概述17
2.1ChatGPT模型简介17
2.1.1模型架构17
2.1.2训练过程18
2.1.3模型不足19
2.2Mamba模型简介20
2.2.1模型架构20
2.2.2技术细节21
2.2.3模型原理22
2.3MoE模型简介23
2.3.1模型架构23
2.3.2技术细节23
2.3.3计算优化26
2.4总结与习题27
2.4.1本章总结27
2.4.2本章习题28
目录〖3〗第3章大模型基础调优与评估29
3.1大模型微调29
3.1.1大模型微调技术起源29
3.1.2不同模型微调数据30
3.1.3LoRA技术32
3.1.4强化反馈技术37
3.1.5思维链技术42
3.1.6大模型微调技术对比46
3.2大模型对齐47
3.2.1大模型对齐的定义与意义47
3.2.2对齐方法分类49
3.2.3主要对齐技术51
3.2.4大模型对齐评估59
3.3大模型评估65
3.3.1大模型评估的介绍65
3.3.2大... 查看详情
"u 本书从大模型的基础理论、优化方法到能力扩展,全面覆盖了大模型的核心技术,帮助读者构建完整的知识体系,逐步深入理解大模型的技术演进与挑战。
u 本书深入分析了生成式人工智能在学术界和产业界的**发展,帮助读者把握技术趋势,了解大模型技术在各个领域的应用潜力,预见未来的技术创新与突破。
u 本书不仅适合作为计算机相关专业的教材,还可作为生成式人工智能领域的研究参考书,具有很高的适用性与指导价值,适合高等院校教学与研究使用。
"





