目 录
第 1 部分 基础与理论
第 1 章 初识智能体 2
1.1 智能体是什么 2
1.2 AI智能体的类型 3
1.3 AI智能体的功能 4
1.4 智能体核心组件 6
1.5 智能体的发展历程 9
1.6 智能体与大模型的关系 9
1.7 AI智能体的应用场景 10
1.8 本章小结 12
第 2 章 Agent开发环境配置 14
2.1 智能体开发环境安装 14
2.1.1 Anaconda的下载与安装 15
2.1.2 PyTorch的下载与安装 16
2.1.3 PyCharm的安装与使用 19
2.2 LLM的调用与使用 20
2.2.1 ModelScope(魔搭社区) 20
2.2.2 Qwen3的本地调用 21
2.2.3 Qwen3的在线调用 24
2.3 本章小结 27
第 3 章 智能体的关键技术 28
3.1 规划与推理 28
3.1.1 CoT框架:分步推理 28
3.1.2 ToT框架:多路径探索式推理 31
3.1.3 ReAct框架:将Reasoning+Acting结合 34
3.2 自适应学习 38
3.2.1 在线微调:人类反馈强化学习 38
3.2.2 参数高效微调:Adapter与Prefix-tuning 43
3.3 多Agent协同 52
3.3.1 角色分工:定义不同Agent的职能 52
3.3.2 通信协议:基于自然语言或结构化消息 56
3.3.3 竞争协调:拍卖机制或投票系统 62
3.4 感知与理解技术 73
3.4.1 多模态感知 73
3.4.2 环境建模 76
3.5 记忆与知识管理 80
3.5.1 短期记忆 80
3.5.2 长期记忆 85
3.6 本章小结 95
第 4 章 提示工程 96
4.1 提示工程概述 96
4.2 智能体基础架构 98
4.3 提示设计方法 101
4.3.1 零样本提示 101
4.3.2 少样本提示 105
4.3.3 思维链提示 106
4.3.4 自洽性提示 109
4.4 高级提示技术 111
4.4.1 递归提示 111
4.4.2 元提示 114
4.4.3 多智能体协作提示 116
4.4.4 工具增强提示 122
4.5 评估与优化 128
4.5.1 提示效果评估指标 128
4.5.2 A/B测试方法 133
4.5.3 自动优化技术 140
4.5.4 对抗性提示防御 145
4.6 本章小结 149
第 5 章 RAG(检索增强生成)技术 150
5.1 RAG基础概念 150
5.1.1 RAG技术概述 150
5.1.2 RAG架构组成 151
5.1.3 RAG工作流程 152
5.2 检索技术 153
5.2.1 检索方法 153
5.2.2 向量检索技术 155
5.2.3 检索优化策略 163
5.3 生成技术 167
5.3.1 代码生成技术 167
5.3.2 文本生成技术 170
5.3.3 模板生成技术 172
5.4 知识库构建与管理 174
5.4.1 数据来源与预处理 174
5.4.2 知识库更新策略 179
5.4.3 多模态RAG 182
5.5 RAG优化与评估 185
5.5.1 评估指标 185
5.5.2 端到端优化方法 195
5.5.3 常见问题与解决方案 201
5.6 本章小结 214
第 2 部分 开发与实践
第 6 章 智能体开发平台简介 216
6.1 开源平台 216
6.1.1 LangChain 216
6.1.2 AutoSpark 217
6.1.3 AutoGPT 217
6.1.4 Microsoft Autogen 217
6.1.5 MetaGPT 218
6.1.6 DSPy 218
6.1.7 AgentVerse 218
6.1.8 LlamaIndex 218
6.1.9 Hugging Face Transformers Agents 218
6.1.10 SuperAGI 218
6.2 商业平台 218
6.2.1 Dify 219
6.2.2 LlamaIndex 219
6.2.3 腾讯元器 219
6.2.4 文心智能体平台(百度) 219
6.2.5 星辰Agent(科大讯飞) 220
6.2.6 扣子(Coze) 220
6.2.7 阿里云AgentScope 220
6.3 其他平台 221
6.3.1 CrewAI 221
6.3.2 MaxKB 221
6.3.3 FastGPT 221
6.3.4 HuggingFace AgentHub 222
6.3.5 NVIDIA Omniverse Agent 222
6.3.6 AutoGen 222
6.4 本章小结 223
第 7 章 智能体开发流程 224
7.1 需求分析与规划 224
7.2 设计与开发阶段管理 225
7.3 测试与部署策略 226
7.4 本章小结 228
第 8 章 基于LangChain的智能体开发 229
8.1 LangChain框架简介 229
8.1.1 LangChain的框架架构 229
8.1.2 LangChain的基本模块 230
8.1.3 LangChain的基本应用场景 232
8.2 LangChain框架的输入输出 234
8.2.1 提示 234
8.2.2 语言模型 234
8.2.3 输出解析器 235
8.3 LangChain框架的链和表达式语言 236
8.3.1 LangChain框架中的链 236
8.3.2 LangChain表达式语言 237
8.3.3 LCEL中的RunnableLambda 238
8.3.4 LCEL中的RunnableSequence 238
8.3.5 LCEL中的RunnableParallel 240
8.3.6 LCEL中的RunnablePassthrough 242
8.3.7 LCEL中的RunnableBranch 242
8.4 LangChain框架中的记忆 243
8.4.1 记忆的概念 243
8.4.2 BaseChatMessageHistory接口及其子类 243
8.4.3 RunnableWithMessageHistory 244
8.4.4 基于LangChain的聊天机器人 245
8.5 LangChain框架中的检索增强生成 246
8.5.1 检索增强生成介绍 246
8.5.2 索引、检索和生成 248
8.5.3 文档和文档加载器 250
8.5.4 TextLoader、WebBaseLoader和pypdfLoader 251
8.5.5 分割器和递归字符文本分割器 252
8.5.6 嵌入模型 252
8.5.7 向量存储库 253
8.5.8 检索器 254
8.6 LangChain框架中的智能体 258
8.6.1 人工智能代理介绍 258
8.6.2 LangChain中的AI Agent实现方式 259
8.6.3 多智能体框架LangGraph介绍 259
8.6.4 多智能体框架LangGraph中的图 259
8.6.5 多智能体框架LangGraph中的状态 260
8.6.6 多智能体框架图中的节点 261
8.6.7 多智能体框架LangGraph中的边 262
8.6.8 多智能体框架LangChain中的工具 263
8.6.9 再审方法 265
8.7 本章小结 268
第 9 章 基于MCP的智能体开发 269
9.1 MCP基本原理 269
9.2 单机MCP服务器端搭建 270
9.3 单机MCP服务端进阶实现与优化 274
9.4 单机MCP客户端搭建 283
9.5 MCP智能体开发案例 287
9.6 本章小结 288
第 10 章 基于RAG的问答智能体实战 289
10.1 系统架构 289
10.2 核心功能模块设计 291
10.3 本地部署和云部署 293
10.4 完整代码及运行结果 293
10.5 本章小结 300
第 11 章 多模态电商客服机器人实战 301
11.1 系统架构 301
11.2 核心功能模块设计 302
11.3 完整代码及运行结果 304
11.4 本章小结 310
第 3 部分 优化与应用
第 12 章 智能体性能优化与调试技巧 312
12.1 性能瓶颈分析方法 312
12.2 调试工具与策略 314
12.3 优化实践案例分享 315
12.4 本章小结 317
第 13 章 智能体部署与实施方法 318
13.1 部署前的准备 318
13.2 数据准备 319
13.2.1 训练数据(部署前模型优化用) 319
13.2.2 测试数据(部署后效果验证用) 320
13.3 部署方案选择 320
13.3.1 本地部署 320
13.3.2 云端部署 320
13.3.3 边缘设备 321
13.3.4 嵌入式部署 321
13.3.5 专项部署 321
13.4 轻量化技术 322
13.5 成本优化策略 322
13.4.1 算力选型 322
13.4.2 资源调度 323
13.6 本章小结 323
第 14 章 多模态试驾预约Agent实战 324
14.1 系统概述 324
14.2 系统架构 325
14.3 核心功能模块设计 327
14.4 核心技术路径分析 331
14.5 AI试驾预约系统完整实现 332
14.6 本章小结 359
第 15 章 基于RAG的多Agent客户服务系统实战 360
15.1 系统概述 360
15.2 系统架构 361
15.3 核心功能模块设计 362
15.3.1 核心功能模块设计流程 362
15.3.2 核心功能模块设计 363
15.4 实现基于RAG的多Agent客户服务系统 364
15.5 本章小结 373
第 16 章 基于MCP的多Agent旅行规划助手实战 374
16.1 系统概述 374
16.2 系统架构 374
16.3 项目结构 375
16.4 系统的Agent组成 376
16.4.1 用户需求分析Agent 376
16.4.2 目的地推荐Agent 384
16.4.3 行程规划Agent 387
16.4.4 预算管理Agent 389
16.4.5 预订协调Agent 391
16.4.6 应急规划Agent 393
16.5 关键技术实现 396
16.5.1 通信机制 396
16.5.2 多智能体协作规划算法 399
16.5.3 冲突解决机制 405
16.5.4 共享知识库存储历史决策和用户反馈 406
16.6 旅行规划完整工作流程 409
16.6.1 主程序调用(方案1:后端FastAPI实现) 409
16.6.2 主程序调用(方案2:Qwen模型调用+Gradio界面) 417
16.7 本章小结 432
