





定价:59元
印次:2-1
ISBN:9787302649212
出版日期:2023.12.01
印刷日期:2023.12.12
图书责编:贾斌
图书分类:教材
本书是一本基于PaddlePaddle深度学习框架的实践性NLP教程,内容包括文本表示、文本分类、文本匹配、信息抽取、机器翻译、自动文摘、机器阅读理解、聊天机器人设计与实现等多个领域的知识,以及多种经典算法的实践案例。 本书的编写旨在帮助读者了解和掌握如何使用PaddlePaddle深度学习框架来解决NLP问题,并且让读者通过实践操作加深对NLP基本算法、基础任务的理解,无论是初学者还是有经验的研究者,都能从本书中获得有益的NLP编程经验。
李轩涯,博士,毕业于国防科技大学、北京理工大学。百度校园高校合作部总监,中国计算机学会杰出会员、常务理事,中国计算机实践教育联合会副理事长。现主管百度校企合作、校企联合人才培养、校园粉丝生态圈,帮助百度技术、人才及产品品牌在高校领域的推广与影响力传播。
前言 随着人工智能的快速发展与不断进步,自然语言处理已经成为计算机科学中最具前景和活力的领域之一。在本书中,我们将为大家介绍涵盖了从基本的文本处理,到高级的机器阅读理解、聊天机器人等多个研究领域的多种算法实践。 本书的编写遵循了实践导向原则,旨在让读者通过通用实践,具备NLP建模、解决实际场景问题的能力。本书使用百度开源的PaddlePaddle深度学习框架(飞桨),这是我国首个开源深度学习框架,有着完备、活跃的用户社区,能够帮助读者更好地理解NLP技术的应用和实现。 第1章介绍文本表示的基础知识,文本表示是自然语言处理中最基本的问题之一,它涉及将文本转换为计算机能够理解的形式,如onehot、TFIDF、词向量及基于预训练的表示等。 第2章讲解文本分类实践,将文本数据划分为不同的预定义类别,如情感分类、新闻分类、垃圾邮件过滤等,其目的是通过训练模型自动对新的文本进行分类。 第3章讲解文本匹配实践,对两个文本进行比较,如问答匹配、语义匹配、文本摘要等,其目的是通过计算相似度得出文本的相关性和相似程度。 第4章讲解信息抽取实践,从结构化和非结构化的文本中自动抽取特定类型的信息,如命名实体识别、关系抽取、事件抽取等,其目的是将非结构化的文本转化为结构化的数据,方便后续的分析和挖掘。 第5章讲解机器翻译实践,将一种语言的文本翻译成另一种语言的文本,如英译中、中译英等,其目的是实现不同语言之间的信息交流和文化交流。 第6章讲解自动文摘实践,自动地从一个文本中提取出最重要的信息,并生成一个简洁的摘要,如新闻摘...
第1章文本表示
1.1实践一: 基于统计的文本表示
1.2实践二: 基于Word2Vec的文本表示
1.3实践三: 基于预训练的文本表示
第2章文本分类
2.1实践一: 基于BiLSTM的文本分类
2.2实践二: 基于Attention机制的文本分类
2.3实践三: 基于预训练微调的文本分类
2.4实践四: 基于PaddleHub的低俗文本审核
第3章文本匹配
3.1实践一: 基于表示的文本匹配
3.2实践二: 基于交互的文本匹配
3.3实践三: 基于预训练微调的文本匹配
第4章信息抽取
4.1实践一: 基于BiLSTMCRF的命名实体识别
4.2实践二: 基于BiLSTMCRF的事件抽取
4.3实践三: 基于BiLSTM的关系抽取
4.4实践四: 基于预训练微调的关系抽取
4.5实践五: 基于预训练微调的事件抽取
第5章机器翻译
5.1实践一: 基于序列到序列模型的中英机器翻译
5.2实践二: 基于注意力机制的中英机器翻译
5.3实践三: 基于Transformer的中英机器翻译
5.4实践四: 基于预训练微调的中英机器翻译
第6章自动文摘
6.1实践一: 抽取式中文自动文摘
6.2实践二: 生成式英文自动文摘
6.3实践三: 基于预训练微调的中文自动文摘
第7章机器阅读理解
7.1实践一: 基于BiDAF的机器阅读理解
7.2实践二: 基于BE...