文本数据挖掘(第2版)
本书通过实例说明实现相关任务的理论方法和技术思路,使读者能够在充分理解基本原理的基础上掌握应用系统的实现方法。

作者:宗成庆、夏睿、张家俊

定价:99元

印次:2-3

ISBN:9787302612957

出版日期:2022.11.01

印刷日期:2026.01.26

图书责编:孙亚楠

图书分类:学术专著

电子书
在线购买
分享
内容简介
作者简介
前言序言
资源下载
查看详情 查看详情 查看详情

文本数据挖掘是通过机器学习、自然语言处理和推理等相关技术或方法,理解、分析和挖掘文本的内 容,从而完成信息抽取、关系发现、热点预测、文本分类和自动摘要等具体任务的信息处理技术。《文本数据挖掘(第2版)》主 要介绍与文本数据挖掘有关的基本概念、理论模型和实现算法,包括数据预处理、文本表示、文本分类、文本聚类、主题模型、情感分析与观点挖掘、话题检测与跟踪、信息抽取以及文本自动摘要等,最后通过 具体实例展示相关技术在实际应用中的使用方法。《文本数据挖掘(第2版)》书可作为高等院校计算机、自动化、网络安全、大数据分析等专业,以及利用到文本信息处理的交 叉学科(如金融财经、社会人文、生物医药等)的高年级本科生或研究生从事相关研究的入门参考书,也可供相关技术研发人员阅读和参考。

宗成庆,中国科学院自动化所研究员、博士生导师,中国科学院大学岗位教授,ACL/CAAI/CCF Fellow,主要从事自然语言处理、机器翻译和语言认知计算等研究,主持国家项目10余项,发表论文200余篇,出版《统计自然语言处理》、《文本数据挖掘》和Text Data Mining三部专著及两部译著。担任国际计算语言学委员会(ICCL)委员,中国中文信息学会副理事长,曾任亚洲自然语言处理学会(AFNLP)主席,国际一流学术会议ACL’2015和COLING’2020程序委员会主席、ACL’2021大会主席。荣获国家科技进步奖二等奖和多个省部级及国家一级学会的科技奖励,获得北京市优秀教师、中科院优秀导师和国科大李佩教学名师等若干荣誉。享受国务院特殊津贴。张家俊,中国科学院自动化研究所研究员、中国科学院大学岗位教授、博士生导师,主要研究方向为机器翻译和自然语言处理,获得国家优秀青年科学基金资助,入选中国科协首届青年人才托举工程、中国科学院青年创新促进会优秀会员和北京智源青年科学家。发表CCF-A/B类论文80余篇,出版学术专著2部,译著1部。获得中国中文信息学会钱伟长中文信息处理科学技术奖一等奖、青年创新奖一等奖和2020年北京市科学技术奖一等奖等。担任中国中文信息学会青年工作委员会主任和机器翻译专委会副主任。担任ACL/EMNLP/COLING的(资深)领域主席和《自动化学报》等期刊的编委。夏睿,南京理工大学计算机学院教授、博士生导师,研究领域为人工智能、自然语言处理、文本数据挖掘,在国内外重要期刊和会议发表论文60余篇,出版学术专著2部,主持国家和省部级项目近10项,获得国际计算语言学会年会ACL2019杰出论文奖、中国中文信息学会青年创新奖一等奖等荣誉,获得江苏省杰出青年基金资助。

第 2版前言 大数据、大算力、大模型技术的快速发展极大地推动和改变着自然语言处理领域的研究和应用方式、方法,这种改变的速度远远超出了我们的预估和设想。几乎在《文本数据挖掘(第 1版)》出版的同时,预训练语言模型逐渐兴起,并得到了快速推广和应用。随后一系列大规模预训练语言模型不断在文本数据挖掘诸多任务上取得了更强的性能,获得了广泛的成功。与此同时,我们也发现了第 1版中的缺陷和不足,热心的读者以不同方式给我们提出了宝贵的建议。这些因素促使我们撰写了第 2版。 第 2版与第 1版的主要区别体现在如下三个方面:①内容更加丰富:在第 2版中除了增加最近几年流行的预训练语言模型(包括 BERT,GPT-3等)以外,还增加了最后一章技术应用,通过两个应用案例将全书各章的知识点串联起来,让读者看到每一章中介绍的技术如何在实际应用中发挥作用。②对部分内容进行了整合:考虑到神经网络模型是分布式表示和深度学习方法的基础性知识,第 1版第 3章和第 4章中均有涉及,部分内容略有重叠,因此,第 2版对这两章内容进行了整合。③增加了习题:在第 2版中各章最后增加了习题,以便于读者,尤其是学生结合每章的内容进行练习和实践。 在第 2版的撰写过程中得到了很多同事和朋友的帮助,他们或提供素材,或与作者讨论书中的内容,或帮助作者校对书稿。他们是中科院自动化所自然语言处理团队的向露博士和赵阳博士、北京中科凡语科技有限公司技术团队、南京理工大学计算机学院博士生沈祥清等。在此谨向他们表示衷心的感谢!同时感谢在互联网上对本书第 1版提出修改建议的热心读者们。 本书的撰写工作得到了中国科学院大学教材出版中心...

目录
荐语
查看详情 查看详情

目录

第 1章绪论 .......................................................................................................1 

1.1基本概念 ................................................................................................1 

1.2文本挖掘任务 .........................................................................................2 

1.3文本挖掘面临的困难 ...............................................................................5 

1.4方法概述与本书的内容组织 .....................................................................8 

1.5进一步阅读 ........................................................................................... 10 习题 .......................................................................... 查看详情

《文本数据挖掘(第2版)》通过实例说明实现相关任务的理论方法和技术思路,而不过多地涉及实现细节,尽量使读者能够在充分理解基本原理的基础上掌握应用系统的实现方法。

查看详情