





作者:凌峰
定价:99元
印次:1-1
ISBN:9787302685982
出版日期:2025.04.01
印刷日期:2025.03.19
图书责编:王金柱
图书分类:零售
"《大模型RAG应用开发:构建智能生成系统》系统介绍检索增强生成(RAG)技术的核心概念、开发流程和实际应用。《大模型RAG应用开发:构建智能生成系统》共分为11章,第1~3章详细介绍RAG开发的基础,包括环境搭建、常用工具和模块,帮助读者从零开始理解RAG系统的工作原理与开发技巧;第4~8章聚焦RAG系统的具体搭建,从向量数据库的创建、文本的向量化,到如何构建高效的检索增强模型,为开发RAG应用奠定基础;第9~11章通过实际案例,包括企业文档问答系统、医疗文献检索系统和法律法规查询助手的实际开发,帮助读者在特定领域深入理解和应用RAG技术。 《大模型RAG应用开发:构建智能生成系统》适合RAG技术初学者、大模型和AI研发人员、数据分析和挖掘工程师,以及高年级本科生和研究生阅读,也可作为培训机构和高校相关课程的教学用书或参考书。"
凌峰,博士,目前就职于某985高校,长期从事机器学习、人工智能、计算机视觉与大模型领域的研发与教学,在模型优化、训练加速、数据驱动算法开发等方面有深刻见解,参与并主导多项相关科研项目。
前 言 在数字化和信息爆炸的时代,自然语言处理(Natural Language Processing,NLP)技术已成为推动创新和提升效率的关键驱动力。尤其是在需要精准、实时地进行信息交互的应用中,如问答系统、客户支持和专业文档管理等,如何让生成模型实现高效且精准的信息生成与检索成为核心需求。 RAG(Retrieval-augmented Generation,检索增强生成)系统作为生成模型与检索技术的有机结合,为生成模型赋予了强大的检索能力,使其能够从庞大的外部数据库中获取并整合相关信息,显著提升生成内容的准确性与实时性,弥补了传统生成模型更新滞后的缺点。基于Transformer架构的RAG系统不仅在动态信息获取方面表现卓越,还推动了大语言模型在特定领域的深入应用,为信息密集型任务提供了更为先进的解决方案。 本书内容 本书系统介绍了RAG技术的核心原理与应用实践,从基础到实战逐步展开讲解,可帮助读者理解RAG系统的工作原理、搭建方法和优化策略,读者掌握构建和优化RAG系统的全流程。本书共分11章,各章内容概要如下: 第1~3章聚焦RAG开发基础,涵盖开发环境搭建、RAG模型的基本架构、生成模块与检索模块的协同工作机制等,帮助读者建立RAG系统的理论框架,快速掌握RAG开发的基本技能,为后续实战奠定坚实基础。 第4~8章着手构建RAG系统,涉及向量数据库的搭建、数据向量化和文本检索增强的实战内容。读者将学习如何利用FAISS构建高效向量检索系统,并生成嵌入向量以提升检索精度。此外,本部分介绍上下文构建、多轮对话实现及复杂生成任务处理。针对性能优化,讲解了...
第 1 章 搭建RAG开发环境 1
1.1 Python开发环境搭建 1
1.1.1 虚拟环境的创建管理 1
1.1.2 IDE的选择与工作流的搭建 5
1.1.3 依赖库安装与版本管理 8
1.2 RAG开发中常用的Python依赖库 10
1.2.1 数据处理必备库:Pandas与NumPy 10
1.2.2 自然语言处理工具:NLTK与spaCy 13
1.2.3 向量检索与模型处理:FAISS与Transformers库简介 16
1.3 RAG开发中常用的外部模块 20
1.3.1 数据采集与预处理:Requests与BeautifulSoup 20
1.3.2 并行与异步处理:Multiprocessing与Asyncio 24
1.4 RAG与智能体 28
1.4.1 智能体的基本定义与作用 28
1.4.2 智能体的类型:反应型、认知型与学习型 30
1.5 基于RAG的智能体开发基础 31
1.5.1 开发环境与工具 32
1.5.2 智能体开发中的关键算法:搜索、优化与规划 35
1.5.3 智能体的性能评估与调试方法 37
1.6 本章小结 40
1.7 思考题 41
第 2 章 传统生成与检索增强生成 42
2.1 生成式AI和RAG的基本概念 42
2.1.1 生成式AI的核心原理与工作机制 43
2.1.2 生成检索结合 45
2.1.3 检索增强与传统生成模型的区别 48
2.2 为何需要对传统大模型进行检索增强 51
2.2... 查看详情
全书共分为3部分,第一部分(第1~3章)聚焦RAG开发基础,这一部分从基础工具与环境配置入手,逐步介绍RAG模型的基本架构,重点讲解生成模块与检索模块的协同工作机制,帮助读者建立RAG系统的理论框架,为后续实战奠定坚实基础。
第二部分(第4~8章)着手构建RAG系统,涉及向量数据库的搭建、数据向量化和文本检索增强的实战内容。读者将学习如何利用FAISS构建高效向量检索系统,并生成嵌入向量以提升检索精度。此外,本部分介绍上下文构建、多轮对话实现及复杂生成任务处理。针对性能优化,讲解了如何通过参数调整、缓存管理及多线程操作,提升RAG系统在高并发环境中的响应速度。
《大模型RAG应用开发:构建智能生成系统》的第三部分((第9~11章)),展示了 RAG 在企业文档问答、医疗文献检索和法律法规查询等多领域的开发实践。每一个案例都从需求分析出发,完整呈现从数据收集到系统优化的全流程,使读者不仅深刻领悟 RAG 在各领域的广泛适用性,更能收获一套独属于自己且契合实际需求的实战开发流程与宝贵经验。
这本书的独特魅力,在于它绝非单纯的理论堆砌,而是将理论与实践精妙融合,以实战案例和代码示例为血肉,让读者在阅读的过程中,既能透彻理解RAG的深邃原理,又能亲手搭建起符合实际应用需求的 RAG 系统。
无论是初入此领域的新手,渴望快速入门开启探索之旅;还是有一定经验的研发人员,都能在本书中找到属于自己的价值,并将其转化为实实在在的高效应用,堪称构建高效RAG系统的不二之选。"