电子书
在线购买
分享
内容简介
作者简介
前言序言
资源下载
查看详情 查看详情 查看详情

本书全面介绍了统计自然语言处理的基本概念、理论方法和最新研究进展,内容包括形式语言与自动机及其在自然语言处理中的应用、语言模型、隐马尔可夫模型、语料库技术、汉语自动分词与词性标注、句法分析、词义消歧、篇章分析、统计机器翻译、语音翻译、文本分类、信息检索与问答系统、自动文摘和信息抽取、口语信息处理与人机对话系统等,既有对基础知识和理论模型的介绍,也有对相关问题的研究背景、实现方法和技术现状的详细阐述。 本书可作为高等院校计算机、信息技术等相关专业的高年级本科生或研究生的教材或参考书,也可供从事自然语言处理、数据挖掘和人工智能等研究的相关人员参考。

前言 我不是一个言而无信的人,也不是一个做事情拖泥带水的人,但本书的写作却让我被这两个恶名追逼得疲惫不堪。2011年4月我就与出版社签订了本书的出版合同,应诺当年10月底交稿,可是,我对自己的能力估计过高,尤其对自己从日常繁忙的工作中挤出时间来从事本书写作的能力估计过高,当然也对潮水般汹涌而来的各种事务所造成的巨大压力估计不足,致使我不得不在生存与履行诺言之间苦苦地煎熬,挣扎着一点一点地践行自己的承诺。可是,时间还是到了2013年! 我发誓,我已经尽了最大努力勤奋地工作,除了正常的上班和出差以外,几乎把所有的周末和晚上都奉献在了办公室,过着一种无歇息的“非正常生活”,但我毕竟没有三头六臂。我不知道那些耗费了我大量时间的纷杂事情来自何处,我也不知道那些让我天天奔忙的工作意义何在?但是我知道如果我不去那样疲于应对,就很可能早已被那一波接一波花样翻新的滚滚洪流抛甩在岸边。所以,我只能在困惑与无奈中被裹挟着、被推搡着砥砺前行,正所谓“树欲静而风不止”。 无论如何,书稿终于完成了,我做到了我想做的事情。 让我感到庆幸的是,在本书的修改过程中,得到了众多同行和学生的大力帮助。他们的无私奉献和援助使我受益颇丰。修改第1章时,关于“计算语言学”术语的出现时间,曾向冯志伟教授请教。在修改第4章的过程中,俞士汶教授和陆勤教授提供了相关材料,并对部分内容进行了仔细的校对;在修改第5章和第7章的过程中,汪昆博士提供了大量数据和资料;夏睿博士校对了第6章的修改内容;鉴萍博士和王志国博士为修改第8章的内容提供了大量素材,并校对了部分内容;张仰森教授和庄涛博士校对了第9章的相关内容;王厚峰...

目录
荐语
查看详情 查看详情
目录

第1章绪论1

1.1基本概念1

1.1.1语言学与语音学1

1.1.2自然语言处理2

1.1.3关于“理解”的标准5

1.2自然语言处理研究的内容和面临的困难5

1.2.1自然语言处理研究的内容5

1.2.2自然语言处理涉及的几个层次8

1.2.3自然语言处理面临的困难8

1.3自然语言处理的基本方法及其发展11

1.3.1自然语言处理的基本方法11

1.3.2自然语言处理的发展12

1.4自然语言处理的研究现状15

1.5本书的内容安排16

第2章预备知识18

2.1概率论基本概念18

2.1.1概率18

2.1.2最大似然估计18

2.1.3条件概率19

2.1.4贝叶斯法则19

2.1.5随机变量20

2.1.6二项式分布21

2.1.7联合概率分布和条件概率分布21

2.1.8贝叶斯决策理论22

2.1.9期望和方差22

2.2信息论基本概念23

2.2.1熵23

2.2.2联合熵和条件熵24

2.2.3互信息26

2.2.4相对熵27

2.2.5交叉熵27

2.2.6困惑度28

2.2.7噪声信道模型28

2.3支持向量机30

2.3.1线性分类30

2.3.2线性不可分31

2.3.3构造核函数31

第3章形式语言与自动机33

3.1基本概念33

3.1.1图33

3.1.2树33

3.1.3字符串34

3.2形式语言35

3.2.1概述35

3.2.2形式语法的定义35

3.2.3形式语法的类型36

3.2.4CFG识别句子的派生树表示38

3.3自动机理论3... 查看详情

查看详情