图书目录

目    录

第1部分  理论基础与技术框架

第1章  大语言模型推荐系统的技术框架 3

1.1  基本技术详解 3

1.1.1  Transformer架构基础 3

1.1.2  注意力机制 8

1.1.3  大规模向量检索技术 13

1.1.4  Prompt工程与上下文学习技术 17

1.1.5  计算性能优化与并行训练技术 21

1.2  大语言模型推荐系统的核心模块 24

1.2.1  嵌入生成与用户画像建模 25

1.2.2  嵌入生成模块 29

1.2.3  召回模块 32

1.2.4  排序模块 35

1.2.5  实时推荐与上下文处理模块 38

1.3  推荐系统的关键挑战与解决技术 41

1.3.1  数据稀疏性问题 41

1.3.2  高并发环境详解 45

1.4  本章小结 50

1.5  思考题 51

第2章  数据处理与特征工程 52

2.1  数据清洗与标准化 52

2.1.1  异构数据格式标准化处理 52

2.1.2  数据噪声过滤与异常检测 56

2.2  用户画像与物品画像的构建 60

2.2.1  用户兴趣特征生成 61

2.2.2  基于嵌入向量的物品特征提取 65

2.3  特征交互与场景特征生成 69

2.3.1  特征交叉组合实现 69

2.3.2  领域知识的上下文特征增强 73

2.4  本章小结 77

2.5  思考题 77

第2部分  核心技术解析

第3章  嵌入技术在推荐系统中的应用 81

3.1  用户行为嵌入生成技术 81

3.1.1  基于大语言模型的用户行为编码 81

3.1.2  时间序列特征的嵌入优化 84

3.2  多模态数据嵌入技术 88

3.2.1  文本、图像与视频嵌入的融合方法 88

3.2.2  基于CLIP模型的多模态特征联合嵌入 92

3.3  嵌入向量的存储与检索优化 95

3.3.1  使用Faiss进行高效向量检索 95

3.3.2  向量检索优化 98

3.3.3  文本嵌入向量生成 100

3.4  自监督嵌入学习方法 103

3.4.1  自监督学习基本原理 103

3.4.2  基于对比学习的嵌入生成 106

3.5  本章小结 110

3.6  思考题 111

第4章  生成式推荐:从特征到内容 112

4.1  大语言模型生成特征的技术方法 112

4.1.1  GPT生成用户兴趣特征与物品特征 112

4.1.2  T5模型与文本生成 115

4.2  大语言模型生成推荐内容 118

4.2.1  个性化商品描述与广告文案生成 118

4.2.2  基于用户历史行为生成推荐 121

4.3  生成式推荐系统的优化与评估 127

4.3.1  推荐生成结果过滤 127

4.3.2  评估:生成内容与用户点击率 130

4.4  生成约束与RLHF 133

4.4.1  生成约束在推荐任务中的实现 133

4.4.2  基于RLHF的生成质量优化技术 136

4.5  本章小结 140

4.6  思考题 140

第5章  预训练语言模型在推荐系统中的应用 142

5.1  预训练语言模型的架构设计 142

5.1.1  使用PLM进行用户与物品的联合建模 142

5.1.2  Transformer架构对推荐效果的提升 146

5.2  预训练语言模型在冷启动推荐中的应用 149

5.2.1  用户冷启动与物品冷启动的特征生成 149

5.2.2  基于上下文学习的冷启动推荐 153

5.2.3  利用生成模型创建冷启动数据 160

5.3  代码实战:基于MIND数据集构建预训练推荐系统 163

5.3.1  数据集加载与预处理 163

5.3.2  用户与物品特征的嵌入生成 166

5.3.3  预训练模型的构建与优化 169

5.3.4  推荐结果的推理与评估 172

5.3.5  模型改进与迭代开发 175

5.4  本章小结 181

5.5  思考题 182

第3部分  模型优化与进阶技术

第6章  微调技术与个性化推荐 185

6.1  微调推荐模型的关键技术 185

6.1.1  PEFT 185

6.1.2  RLHF 191

6.2  个性化推荐系统的实现 196

6.2.1  针对长尾用户的微调策略 196

6.2.2  微调后推荐系统的效果提升 201

6.3  案例分析:TALLRec框架在个性化推荐中的应用 206

6.3.1  微调模型的训练与部署 206

6.3.2  基于用户行为的个性化推荐实现 210

6.3.3  TALLRec的多任务学习在推荐中的应用 214

6.4  参数高效微调(LoRA)的实现与应用 219

6.4.1  LoRA技术的具体实现与代码分析 219

6.4.2  LoRA优化推荐系统的实际案例 222

6.5  本章小结 227

6.6  思考题 228

第7章  上下文学习与直接推荐技术 229

7.1  大语言模型上下文学习的技术实现 229

7.1.1  提示词工程 229

7.1.2  动态上下文学习与实时推荐 231

7.2  Prompt优化与自适应推荐系统 234

7.2.1  连续Prompt生成 234

7.2.2  用户意图检测与自适应推荐算法 236

7.3  基于Few-shot和Zero-shot的推荐任务 239

7.3.1  Few-shot推荐任务的案例与技术解析 239

7.3.2  Zero-shot推荐任务案例分析 242

7.4  本章小结 248

7.5  思考题 248

第8章  多任务学习与交互式推荐系统 250

8.1  多任务学习模型的架构设计 250

8.1.1  多任务学习模型在推荐中的应用 250

8.1.2  多任务优化 253

8.2  交互式推荐系统的智能体架构 257

8.2.1  交互式推荐中的Agent系统简单实现 257

8.2.2  用户实时反馈对推荐模型的动态更新 259

8.3  实战案例:基于LangChain实现对话式推荐 262

8.3.1  用户对话驱动的推荐生成 262

8.3.2  多轮对话中的上下文管理问题 264

8.3.3  对话与推荐融合 266

8.3.4  云端部署LangChain系统 268

8.4  本章小结 271

8.5  思考题 272

第4部分  实战与部署

第 9 章  排序算法与推荐结果优化 275

9.1  排序算法的核心技术 275

9.1.1  Transformer生成排序特征的方法 275

9.1.2  CTR预测模型 277

9.2  排序优化的代码实现 280

9.2.1  Wide&Deep模型排序案例 281

9.2.2  使用GBDT进行特征排序与评分 284

9.3  基于Learning-to-Rank的排序优化 287

9.3.1  Pointwise、Pairwise和Listwise方法解析 288

9.3.2  使用Learning-to-Rank优化推荐系统排序的案例 290

9.4  本章小结 295

9.5  思考题 296

第10章  冷启动问题与长尾问题详解 298

10.1  冷启动问题的技术解决方案 298

10.1.1  利用大语言模型生成初始用户行为样本 298

10.1.2  新品与冷门内容的长尾推荐 301

10.2  长尾用户的动态兴趣建模 303

10.2.1  兴趣迁移 303

10.2.2  基于行为序列的动态特征生成 305

10.3  冷启动推荐的案例分析 307

10.3.1  冷启动推荐系统的代码实现 307

10.3.2  基于大语言模型的物品冷启动解决方案 309

10.3.3  长尾内容的推荐优化 311

10.3.4  案例实战:公众号冷启动推荐 313

10.4  本章小结 315

10.5  思考题 316

第11章  推荐系统开发基础 317

11.1  推荐系统的分布式架构设计 317

11.1.1  微服务框架下的推荐模块部署 317

11.1.2  ONNX模型转换与TensorRT推理加速 319

11.1.3  分布式向量检索服务的负载均衡 322

11.1.4  高可用推荐服务容错与恢复机制 324

11.2  推荐服务的高并发优化 326

11.2.1  实时推荐服务的缓存机制设计 326

11.2.2  异步处理与批量推理的性能提升 329

11.2.3  动态负载均衡在推荐服务中的应用 331

11.2.4  使用分布式消息队列优化高并发推荐流 333

11.3  推荐系统的日志与监控模块 336

11.3.1  实时监控系统性能与用户行为数据 336

11.3.2  日志采集与分布式存储架构 338

11.3.3  异常检测与告警系统 341

11.3.4  推荐效果评估反馈 345

11.4  本章小结 348

11.5  思考题 348

第12章  基于大模型的电商平台推荐系统开发 350

12.1  项目规划与系统设计 350

12.1.1  基于大语言模型的推荐系统整体架构设计 350

12.1.2  需求分析与功能模块划分 353

12.2  数据管理模块 355

12.2.1  数据采集、清洗与规范化 355

12.2.2  用户与物品特征生成 357

12.3  嵌入生成与召回模块开发 361

12.3.1  基于大模型的嵌入生成 361

12.3.2  向量检索与召回 363

12.4  排序与优化模块 365

12.4.1  CTR生成式排序模型 365

12.4.2  使用LTR优化推荐效果 368

12.5  系统部署与实时服务 371

12.5.1  模型转换与ONNX优化 371

12.5.2  分布式推理服务与API接口开发 373

12.5.3  模型微调与部署 376

12.6  性能监控与日志分析 380

12.7  本章小结 383

12.8  思考题 384