


作者:[美]斯楠·奥兹德米尔(Sinan Ozdemir)著 姚普 白涛 卜崇宇 王蜀洪 译
定价:79元
印次:1-2
ISBN:9787302661610
出版日期:2024.06.01
印刷日期:2024.12.11
图书责编:袁金敏
图书分类:零售
"本书主要围绕如何充分挖掘、利用大语言模型的潜力,囊括了大语言模型的概念,如何通过 提示词更好地利用大语言模型,大语言模型在信息检索、推荐系统、视觉问答等任务中的应用, 以及大语言模型的微调、多模态训练、模型生产应用等高阶使用技巧。本书在讲解过程中搭配 大量的应用实例以及相关代码,从大语言模型的概念、挖掘大语言模型潜力的方式到大语言模 型的高级使用方式,读者能够将概念学习和实践应用同步进行,是相关领域工程技术人员、学术 人员以及对大语言模型感兴趣的广大读者的不二之选。 本书的内容编排适合以下群体: (1) 有一定的编程能力,但对大语言模型没有充分的认知,想通过本书迅速掌握大语言模型 的概念,并在相关业务领域(信息检索、对话系统、推荐系统等)实现快速应用。 (2) 大语言模型某个研究领域的资深从业人员,但是想更全面地了解大语言模型在各个领 域的研究应用现状,实现对大语言模型从学术研究到生产应用的全方位系统认知。"
"斯楠·奥兹德米尔(Sinan Ozdemir) 拥有数学硕士学位,是一位成功的人工智能企业家和风险投资顾问。在担任约翰·霍普金斯大学讲师期间,首次涉足数据科学和机器学习,并发明了人工智能领域的多项专利。后来创立了Kylie.ai——一个融合了对话式人工智能和机器人能力的创新平台。Kylie.ai很快就因其独特的价值主张而受到关注,最终被收购。在此期间, 斯楠·奥兹德米尔开始创作大量关于数据科学、人工智能和机器学习的作品。关于译者姚普 中国科学院大学博士,现任京东资深算法工程师,多年从事算法设计与开发、算法框架引擎开发、算法产品化开发,在图算法和大模型领域深耕多年,《图深度学习从理论到实践》作者。"
前言 笔者原来是一名理论数学家、大学讲师,后来成为人工智能爱好者,再后来成为成功的创业公司创始人、人工智能教科书作者、风险投资顾问。今天,笔者还可以作为导游,带读者参观 LLM工程和应用这个巨大的知识博物馆。本书的编写有两个目的: 一是揭开LLM领域的神秘面纱,二是为读者提供实用的知识,使读者能够开始实验、编码和构建LLM。 与在课堂上大多数教授的讲解不同,本书并不是要用复杂的术语向读者灌输,相反,本书的目的是使复杂的概念易于理解、容易与常识关联起来,更重要的是具有实用性。 坦率地说,于笔者而言,本书内容已经相当充分。笔者想给读者一些关于如何阅读本书的提示, 多次阅读本书,确保自己从本书中获得自己所需的知识。 读者人群和预备知识 本书是为谁准备的?答案很简单: 任何对LLM充满好奇心的人,有意愿的程序员,不懈的学习者。无论你在机器学习领域已有见解,还是正准备开始学习相关知识,本书都是你的指南,是为你导航LLM领域的地图。 为了最大限度地利用这段旅程,拥有一些机器学习和Python方面的经验将是非常有益的。这并不是说没有它们你将无法 继续,而是没有这些工具, 阅读的过程可能有点波折。如果你准备边读边学习,那也很好。我们将探索的一些概念 并不一定全部需要大量的编码,但大多数是需要的。 在本书中,笔者试图在深入的理论理解和实际的实践技能之间找到平衡。书中每章都充满了类比,将复杂的事物变得简单,并配以代码片段,使概念更加生动。本质上,笔者是将这本书作为LLM讲师+助教,旨在简化和揭开 LLM引人入胜的...
第1部分大模型介绍
第1章大模型概述
1.1什么是大模型
1.1.1大模型的定义
1.1.2大模型的关键特征
1.1.3大模型是如何工作的
1.2当前流行的大模型
1.2.1BERT
1.2.2GPT3和 ChatGPT
1.2.3T5
1.3垂直领域大模型
1.4大模型的应用
1.4.1经典的NLP任务
1.4.2自由文本生成
1.4.3信息检索/神经语意搜索
1.4.4聊天机器人
1.5本章小结
第2章大模型语义检索
2.1简介
2.2语义检索的任务
2.3非对称语义检索方案概述
2.4组件
2.4.1文本嵌入器
2.4.2文档分块
2.4.3向量数据库
2.4.4Pinecone
2.4.5开源替代方案
2.4.6检索结果重排
2.4.7API
2.5完整方案
2.6闭源组件的成本
2.7本章小结
第3章提示词工程入门
3.1简介
3.2提示词工程
3.2.1LLM的对齐
3.2.2LLM提问
3.2.3小样本学习
3.2.4结构化输出
3.2.5人物角色提示词
3.3跨模型提示词工程
3.3.1ChatGPT
3.3.2Cohere
3.3.3开源提示词工程
3.4采用ChatGPT构建问答机器人
3.5本章小结
第2部分充分挖掘大模型的潜力
第4章通过定制化微调优化大模型
... 查看详情
提示词更好地利用大语言模型,大语言模型在信息检索、推荐系统、视觉问答等任务中的应用,
以及大语言模型的微调、多模态训练、模型生产应用等高阶使用技巧。本书在讲解过程中搭配
大量的应用实例以及相关代码,从大语言模型的概念、挖掘大语言模型潜力的方式到大语言模
型的高级使用方式,读者能够将概念学习和实践应用同步进行,是相关领域工程技术人员、学术
人员以及对大语言模型感兴趣的广大读者的不二之选。
本书的内容编排适合以下群体:
(1) 有一定的编程能力,但对大语言模型没有充分的认知,想通过本书迅速掌握大语言模型
的概念,并在相关业务领域(信息检索、对话系统、推荐系统等)实现快速应用。
(2) 大语言模型某个研究领域的资深从业人员,但是想更全面地了解大语言模型在各个领
域的研究应用现状,实现对大语言模型从学术研究到生产应用的全方位系统认知。"

