





定价:66元
印次:1-4
ISBN:9787302165989
出版日期:2008.05.01
印刷日期:2012.11.15
图书责编:薛慧
图书分类:零售
本书全面介绍了统计自然语言处理的基本概念、理论方法和最新研究进展,内容包括形式语言与自动机及其在自然语言处理中的应用、语言模型、隐马尔可夫模型、语料库技术、汉语自动分词与词性标注、句法分析、词义消歧、统计机器翻译、语音翻译、文本分类、信息检索与问答系统、自动文摘和信息抽取、口语信息处理与人机对话系统等,既有对基础知识和理论模型的介绍,也有对相关问题的研究背景、实现方法和技术现状的详细阐述。 本书可作为高等院校计算机、信息技术等相关专业的高年级本科生或研究生的教材或参考书,也可供从事自然语言处理、数据挖掘和人工智能等研究的相关人员参考。
自然语言处理技术的产生可以追溯到20世纪50年代,它是一门集语言学、数学、计算机科学和认知科学等于一体的综合性交叉学科。近几年来,随着计算机网络技术和通信技术的迅速发展和普及,自然语言处理技术的应用需求急剧增加,人们迫切需要实用的自然语言处理技术来帮助人们打破语言屏障,为人际之间、人机之间的信息交流提供便捷、自然、有效的人性化服务。但是,自然语言处理中的若干科学问题和技术难题尚未得到解决,有待于来自不同领域的学者深入研究和探索。 中文信息处理作为自然语言处理中的一个分支,近几年来备受关注。一方面,随着中国经济的迅速发展和中国国力的不断增强,汉语正在成为一种新的强势语言而被世人瞩目,汉语理解所涉及的科学问题让国际计算语言学界无法回避;而另一方面,汉语使用者所拥有的巨大市场潜力令国际企业界不敢轻视。因此,中文信息处理成为全球自然语言处理研究者们共同关注的问题已经是不争的事实。目前国际上每年举行的颇具影响的几种技术评测,包括机器翻译评测、信息抽取评测和句法分析评测等,无不与汉语密切相关。因此,作为炎黄子孙,我们没有理由不在这一领域的研究中做出应有的贡献。 中文信息处理所面临的困难既有其他任何一种自然语言处理都会遇到的共性问题,如生词识别问题、歧义消解问题等,也有中文处理本身所具有的个性化问题,如汉语自动分词问题、词性定义规范问题等。因此,从某种意义上讲,中文信息处理更具挑战性。值得欣慰的是,中文信息处理在引起国际学术界和企业界关注的同时,得到了中国政府的重视和大力支持,它已经被列入国务院批准的“国家中长期科学技术发展规划纲要”。因此,中文信息处理面临着前所...
1.1 基本概念 1
1.1.1 语言学与语音学1
1.1.2 自然语言处理2
1.1.3 关于“理解”的标准4
1.2 自然语言处理研究的内容和面临的困难4
1.2.1 自然语言处理研究的内容4
1.2.2 自然语言处理涉及的几个层次5
1.2.3 自然语言处理面临的困难6
1.3 自然语言处理的基本方法及其发展8
1.3.1 自然语言处理的基本方法8
1.3.2 自然语言处理的发展9
1.4 自然语言处理的研究现状12
第2章 预备知识14
2.1 概率论基本概念14
2.1.1 概率14
2.1.2 最大似然估计14
2.1.3 条件概率15
2.1.4 贝叶斯法则15
2.1.5 随机变量16
2.1.6 二项式分布17
2.1.7 联合概率分布和条件概率分布17
2.1.8 贝叶斯决策理论17
2.1.9 期望和方差18
2.2 信息论基本概念19
2.2.1 熵19
2.2.2 联合熵和条件熵192.2.3 互信息21
2.2.4 相对熵22
2.2.5 交叉熵22
2.2.6 困惑度23
2.2.7 噪声信道模型23
2.3 支持向量机25
2.3.1 线性分类25
2.3.2 线性不可分26
2.3.3 构造核函数26
第3章 形式语言与自动机28
3.1 基本概念28
3.1.1 图28
3.1.2 树28
3.1.3 字符串29
3.2 形式语言30
3.2.1 概述30
3.2.2 形式语法的定义30
3.2.3 形式语法的类型31
3.2.... 查看详情