自然语言处理实践(第2版)
本书提供PDF课件,理论翔实,代码精细,内容以百度飞桨为实验平台,兼具基础理论与编程实战。

作者:李轩涯、曹焯然、计湘婷

丛书名: 高等学校智能科学与技术/人工智能专业教材

定价:59元

印次:2-1

ISBN:9787302649212

出版日期:2023.12.01

印刷日期:2023.12.12

图书责编:贾斌

图书分类:教材

电子书
在线购买
分享
内容简介
作者简介
前言序言
资源下载
查看详情 查看详情 查看详情

本书是一本基于PaddlePaddle深度学习框架的实践性NLP教程,内容包括文本表示、文本分类、文本匹配、信息抽取、机器翻译、自动文摘、机器阅读理解、聊天机器人设计与实现等多个领域的知识,以及多种经典算法的实践案例。 本书的编写旨在帮助读者了解和掌握如何使用PaddlePaddle深度学习框架来解决NLP问题,并且让读者通过实践操作加深对NLP基本算法、基础任务的理解,无论是初学者还是有经验的研究者,都能从本书中获得有益的NLP编程经验。

李轩涯,博士,毕业于国防科技大学、北京理工大学。百度校园高校合作部总监,中国计算机学会杰出会员、常务理事,中国计算机实践教育联合会副理事长。现主管百度校企合作、校企联合人才培养、校园粉丝生态圈,帮助百度技术、人才及产品品牌在高校领域的推广与影响力传播。

前言 随着人工智能的快速发展与不断进步,自然语言处理已经成为计算机科学中最具前景和活力的领域之一。在本书中,我们将为大家介绍涵盖了从基本的文本处理,到高级的机器阅读理解、聊天机器人等多个研究领域的多种算法实践。 本书的编写遵循了实践导向原则,旨在让读者通过通用实践,具备NLP建模、解决实际场景问题的能力。本书使用百度开源的PaddlePaddle深度学习框架(飞桨),这是我国首个开源深度学习框架,有着完备、活跃的用户社区,能够帮助读者更好地理解NLP技术的应用和实现。 第1章介绍文本表示的基础知识,文本表示是自然语言处理中最基本的问题之一,它涉及将文本转换为计算机能够理解的形式,如onehot、TFIDF、词向量及基于预训练的表示等。 第2章讲解文本分类实践,将文本数据划分为不同的预定义类别,如情感分类、新闻分类、垃圾邮件过滤等,其目的是通过训练模型自动对新的文本进行分类。 第3章讲解文本匹配实践,对两个文本进行比较,如问答匹配、语义匹配、文本摘要等,其目的是通过计算相似度得出文本的相关性和相似程度。 第4章讲解信息抽取实践,从结构化和非结构化的文本中自动抽取特定类型的信息,如命名实体识别、关系抽取、事件抽取等,其目的是将非结构化的文本转化为结构化的数据,方便后续的分析和挖掘。 第5章讲解机器翻译实践,将一种语言的文本翻译成另一种语言的文本,如英译中、中译英等,其目的是实现不同语言之间的信息交流和文化交流。 第6章讲解自动文摘实践,自动地从一个文本中提取出最重要的信息,并生成一个简洁的摘要,如新闻摘...

暂无课件

样章下载

暂无网络资源

扫描二维码
下载APP了解更多

目录
荐语
查看详情 查看详情
目录

第1章文本表示

 

1.1实践一: 基于统计的文本表示

1.2实践二: 基于Word2Vec的文本表示

1.3实践三: 基于预训练的文本表示

第2章文本分类 

2.1实践一: 基于BiLSTM的文本分类

2.2实践二: 基于Attention机制的文本分类

2.3实践三: 基于预训练微调的文本分类

2.4实践四: 基于PaddleHub的低俗文本审核

第3章文本匹配 

3.1实践一: 基于表示的文本匹配

3.2实践二: 基于交互的文本匹配

3.3实践三: 基于预训练微调的文本匹配

第4章信息抽取

4.1实践一: 基于BiLSTMCRF的命名实体识别

4.2实践二: 基于BiLSTMCRF的事件抽取

4.3实践三: 基于BiLSTM的关系抽取

4.4实践四: 基于预训练微调的关系抽取

4.5实践五: 基于预训练微调的事件抽取

第5章机器翻译

5.1实践一: 基于序列到序列模型的中英机器翻译

5.2实践二: 基于注意力机制的中英机器翻译

5.3实践三: 基于Transformer的中英机器翻译

5.4实践四: 基于预训练微调的中英机器翻译

第6章自动文摘

6.1实践一: 抽取式中文自动文摘

6.2实践二: 生成式英文自动文摘

6.3实践三: 基于预训练微调的中文自动文摘

第7章机器阅读理解

7.1实践一: 基于BiDAF的机器阅读理解

7.2实践二: 基于BE...

本书是一本基于PaddlePaddle深度学习框架的实践性NLP教程,理论知识翔实,实用性极强。