目录
第1章人工智能基础1
1.1计算机的渊源1
1.1.1为战争而发展的计算机器1
1.1.2通用计算机1
1.2大数据基础3
1.2.1信息爆炸的社会3
1.2.2大数据的定义3
1.2.3大数据的3V特征4
1.3人工智能时代5
1.3.1图灵测试及其发展5
1.3.2人工智能的定义6
1.3.3人工智能的实现途径6
1.3.4大数据造就大智慧8
1.4机器学习与深度学习9
1.4.1机器学习9
1.4.2深度学习11
1.4.3机器学习与深度学习的关系12
【作业】12
【研究性学习】初步应用DeepSeek大模型14
第2章大语言模型技术17
2.1Blockhead思维实验17
2.2从自然语言处理起步18
2.2.1NLP的研究内容18
2.2.2深度学习的影响18
2.2.3LLM的崛起19
2.3大语言模型的工作原理20
2.3.1词元及其标记化21
2.3.2基础模型21
2.3.3词嵌入及其含义22
2.3.4生成和理解22
2.3.5预训练过程与微调22
2.4生成对抗网络23
2.5变分自编码器24
2.5.1VAE的工作机制24
2.5.2潜在空间探索25
2.6流模型26
2.7语言模型基础27
2.8LLM的幻觉27
2.8.1产生幻觉的原因28
2.8.2减轻幻觉病症28
【作业】29
【研究性学习】大语言生成模型典型案例分析31
第3章生成式AI与AIGC35
3.1生成式AI35
3.1.1定义判别式AI35
3.1.2定义生成式AI36
3.1.3生成式AI的层次37
3.1.4定义AIGC38
3.1.5生成式AI与AIGC的关系39
3.2智能内容生成40
3.2.1内容孪生40
3.2.2内容编辑40
3.2.3内容理解40
3.3生成式AI应用场景41
3.4接入LLM的几种方法43
3.4.1个人直接使用平台功能43
3.4.2通过平台搭建智能体43
3.4.3通过API调用44
3.4.4私有化本地部署44
3.4.5通过云服务商间接部署45
3.4.6渐进式接入45
【作业】45
【研究性学习】熟悉阿里云“通义”大模型47
第4章文本生成技术51
4.1典型的语言模型方法51
4.1.1基于规则的方法51
4.1.2统计语言模型52
4.1.3RNN及其变体53
4.2Transformer模型55
4.2.1位置编码机制55
4.2.2自注意力机制55
4.2.3Transformer过程56
4.3混合模型59
4.4典型的文本生成技术60
4.4.1文本摘要技术60
4.4.2诗歌生成61
4.4.3简单对话系统62
4.4.4翻译任务中的应用63
4.5文本生成面临的挑战64
【作业】65
【研究性学习】熟悉AI助手Kimi大模型66
第5章图像生成技术69
5.1图像生成的模型69
5.1.1扩散模型69
5.1.2自回归模型70
5.1.3图像生成典型模型71
5.1.4图像生成的应用场景71
5.2图像风格迁移73
5.2.1基本原理74
5.2.2代表性算法74
5.3超分辨率重建75
5.3.1基本原理75
5.3.2基于学习的方法76
5.4视频生成76
5.4.1基本原理77
5.4.2主要方法77
5.4.3代表性算法78
5.5医疗影像合成78
5.5.1基本原理78
5.5.2主要方法79
5.5.3代表性算法79
5.6挑战与未来发展80
【作业】81
【研究性学习】基于深度学习的图像生成83
第6章音频与音乐生成技术85
6.1音频与音乐生成85
6.2波形建模86
6.2.1核心技术86
6.2.2工作原理87
6.3音乐旋律生成88
6.4语音合成89
6.4.1合成技术89
6.4.2基本原理90
6.4.3合成质量91
6.5音频增强与修复91
6.5.1噪声减少91
6.5.2回声消除92
6.5.3音频修复93
6.5.4动态范围压缩94
6.5.5等化95
6.5.6时间拉伸与音高转换97
6.5.7应用机器学习方法98
【作业】100
【研究性学习】探索音乐旋律生成模型102
第7章多模态生成技术104
7.1多模态生成概述104
7.1.1技术基础105
7.1.2模型结构融合策略105
7.2视觉与文本结合106
7.2.1图像字幕生成106
7.2.2视觉问答106
7.2.3基于文本的图像合成与编辑107
7.2.4情感一致性的视觉与文本生成107
7.2.5案例: 谷歌Muse文本到图像生成108
7.3跨媒体内容生成108
7.3.1图像到文本生成109
7.3.2跨媒体翻译110
7.3.3多模态对话系统110
7.4智能感知与响应111
7.4.1智能感知的技术基础111
7.4.2智能响应决策制定112
7.5应用与发展112
7.5.1多模态生成的应用场景113
7.5.2技术挑战与发展趋势115
【作业】116
【研究性学习】多模态生成技术应用——“情感音乐可视化”118
第8章智能体与AIGC121
8.1什么是智能体121
8.1.1智能体的定义121
8.1.2性能度量122
8.1.3智能体的理性122
8.2环境的本质123
8.2.1指定任务环境123
8.2.2任务环境的属性124
8.3智能体的结构125
8.3.1智能体程序126
8.3.2学习型智能体127
8.3.3智能体组件的工作128
8.4AI的下一个风口: 智能体129
8.4.1智能体的关键趋势129
8.4.2构建LLM智能体130
8.4.3AIGC与智能体的联系131
8.4.4智能体AI时代132
【作业】133
【研究性学习】分析智能体的设计与行为135
第9章提示工程与技巧137
9.1提示工程的定义137
9.2提示的原理138
9.2.1提示词的分类139
9.2.2提示构成140
9.2.3提示调优141
9.3提示工程技术141
9.3.1链式思考提示142
9.3.2生成知识提示143
9.3.3少样本提示143
9.3.4自一致提示143
9.3.5思维树提示144
9.4提示词写作技巧145
9.4.1提示词框架推荐145
9.4.2提示词实践技巧147
【作业】149
【研究性学习】练习撰写提示词151
第10章AIGC的实施与应用模式153
10.1算法、算力与算料153
10.1.1算法: AI的智慧之源153
10.1.2算力: AI的动力引擎153
10.1.3算力中的GPU154
10.1.4算料: AI的燃料之源155
10.2闭源还是开源155
10.2.1开源LLM的优势156
10.2.2典型的开源LLM156
10.3成功实施生成式AI157
10.4按词元收费的模式158
10.4.1为什么要按词元收费158
10.4.2按词元和传统API收费的不同159
10.5接入大模型的风控问题160
10.5.1接入LLM面临的风险160
10.5.2LLM的企业风控160
【作业】161
【研究性学习】AIGC应用开发与风险评估164
第11章AIGC改善民生质量166
11.1AIGC发展文学创作166
11.1.1对文化创意的影响167
11.1.2自动写作与创作167
11.1.3激发创意灵感168
11.1.4图像生成与编辑168
11.2AIGC音乐与音频制作169
11.2.1自动作曲与音效合成169
11.2.2音频处理与配乐169
11.3AIGC用在影视娱乐170
11.3.1剧本开发与优化170
11.3.2AIGC视频生成170
11.3.3风格迁移171
11.3.4效果生成与智能剪辑171
11.3.5互动式影视体验172
11.4AIGC应用于医疗行业172
11.4.1循证医学及其发展173
11.4.2AIGC医疗行业应用场景174
11.5AIGC加速药物发现175
11.5.1在药物发现中的作用175
11.5.2助力药物开发研究175
11.6医疗健康应用案例176
11.6.1医学影像诊断系统176
11.6.2智能病历管理系统177
【作业】178
【研究性学习】文生图: 注册使用Midjourney绘图工具181
第12章AIGC提高服务水平183
12.1AIGC应用于设计183
12.1.1设计应用场景183
12.1.2与设计师协同作业184
12.2数据增强与模拟185
12.2.1数据增强185
12.2.2科学模拟186
12.2.3自动化实验设计186
12.2.4模型训练与改进187
12.2.5理论验证与假设测试187
12.3AIGC在金融服务中的应用188
12.3.1智能客服188
12.3.2风险评估189
12.3.3个性化推荐190
12.3.4智能投顾190
12.4智慧城市建设应用AIGC192
12.4.1智慧城市的关键特点192
12.4.2城市安防监控192
12.4.3环境保护193
12.4.4智能公共服务193
12.4.5智慧城市建设与管理193
12.4.6智慧社区193
12.4.7智能交通管理193
12.4.8自动驾驶195
【作业】196
【研究性学习】AIGC智能交通应用案例分析198
第13章伦理与法律考量203
13.1AIGC面临的伦理挑战203
13.2数据隐私保护对策 204
13.2.1数据主权和数据权问题204
13.2.2数据利用失衡问题204
13.2.3构建隐私保护伦理准则205
13.2.4健全道德伦理约束机制205
13.3AI伦理原则206
13.3.1职业伦理准则的目标206
13.3.2创新发展道德伦理宣言207
13.3.3欧盟可信赖的伦理准则208
13.4LLM的知识产权保护209
13.4.1LLM的诉讼案例209
13.4.2尊重隐私,保障安全,促进开放212
13.4.3边缘群体的数字平等213
【作业】213
【研究性学习】AI独立完成的视觉艺术品无法获得版权215
第14章面向通用人工智能217
14.1生成式AI的未来发展217
14.2AGI的涌现218
14.2.1AGI的定义219
14.2.2OpenAI对AGI的认识220
14.3LLM与AGI220
14.4生成式AI与AGI221
14.5从生成式AI迈向AGI222
14.5.1LLM及其潜力现状223
14.5.2面临的挑战223
14.5.3潜在的发展路径223
14.6AI的未来发展224
【作业】224
【课程学习与实验总结】227
附录A作业参考答案231
参考文献234
