计算语言学(修订 版)

作者:刘颖

定价:59元

印次:1-1

ISBN:9787302378143

出版日期:2014.09.01

印刷日期:2014.09.19

图书责编:梁斐

图书分类:教材

电子书
在线购买
分享
内容简介
作者简介
前言序言
资源下载
查看详情 查看详情 查看详情

计算语言学是一门涉及语言学、计算机科学和数学等多门学科的交叉学科,覆盖面广。本书侧重最经典的工作,阐述计算语言学的基本理论和方法,主要介绍现代句法理论和语义理论,词法、句法和语义阶段重要的分析算法、统计语言学和机器翻译。本书结构完整,层次分明,条理清楚;既便于教学,又便于自学。可作为中文、外语、计算机等专业高年级本科生和研究生教材,也可供从事自然语言处理或信息处理的研究者参考。

1998年从中科院计算所博士毕业后一直在清华中文系工作,2002年被评为副教授。从2006年2月开始的一年时间,在美国卡耐基梅隆大学语言技术研究所作访问学者。共发表论文50多篇。用英文在“IEEE自然语言处理和知识工程”等国际会议发表论文20多篇,用中文在《中文信息学报》、《计算机研究与发展》和《计算机科学》等中文核心期刊发表20多篇;有17篇被EI检索,4篇进入EI刊源,10篇被ISTP检索。2002年出版《计算语言学》,2010年出版《离散数学》,2012年出版《语料库语言学》。

前言 计算语言学,也称自然语言处理或自然语言理解,它是研究如何利用计算机来分析、处理和理解自然语言的一门学科。计算语言学是植根于计算机科学、语言学和数学等多学科沃土而成长起来的一门新兴学科。一般情况下,处理自然语言不仅要有语言学方面的知识,而且还要有数学和计算机科学方面的知识,因此,计算语言学就成为一门介于语言学、数学和计算机科学之间的边缘性交叉学科。 本书第1章主要介绍计算语言学与计算机科学、数学和语言学学科之间的关系,并介绍了计算语言学的基本方法、主要内容、应用领域以及发展过程。第2章主要介绍了自然语言处理常用的语法词典、语义词典和语义框架词典及其应用。语法词典介绍了《现代汉语语法信息词典》,语义词典介绍了wordnet 、《同义词词林》和《知网》,除此之外还介绍了语义框架词典framenet。第3章主要介绍汉语的切词、切词歧义以及如何消歧,介绍了英语的形态分析及主要分析算法以及日语的分词、分词歧义、分词算法和日语开源分词软件。第4章主要介绍词性标注的4种方法——规则方法、统计方法、规则与统计结合以及基于转换的错误驱动方法。重点介绍用隐马尔可夫模型、条件随机场和最大熵模型进行词性标注的统计处理过程。第5章主要介绍乔姆斯基的4种类型的文法和4种类型的自动机。文法和自动机是刻画语言的有效手段,文法用来生成语言中的句子,自动机用来识别语言的句子,就描述一种语言而言,两者是统一的。前者属于形式语法理论,后者属于自动机理论。第6章主要介绍20世纪50年代以来发展起来的用于自然语言处理的一些重要的句法理论,主要有基于类的语法理论和基于词的语法理论,基于类的语法理论有:转换生成语...

目录
荐语
查看详情 查看详情
目录

第1章计算语言学简介

1.1计算语言学

1.1.1计算语言学概念

1.1.2计算语言学与计算机科学

1.1.3计算语言学与语言学

1.1.4计算语言学与数理语言学

1.1.5计算语言学与自然语言

1.2计算语言学主要研究的内容

1.3计算语言学理论的主要用途

1.3.1机器翻译

1.3.2语音自动识别和自动生成

1.3.3自动文摘

1.3.4自动校对

1.3.5自然语言理解

1.3.6信息自动检索

1.3.7自动问答

1.3.8自动分类

1.3.9信息抽取

1.4计算语言学研究的基本方法

1.4.1理性主义和经验主义

1.4.2理性主义和经验主义的区别

1.5计算语言学的发展历程

1.6本章小结

第2章机器词典

2.1《现代汉语语法信息词典》

2.2《同义词词林》

2.3Wordnet

2.4Framenet

2.5《知网》

2.6本章小结

第3章词法分析

3.1汉语的自动分词

3.1.1词与自动分词

3.1.2汉语自动分词的重要性

3.1.3汉语自动分词方法

3.1.4汉语切分歧义及其处理

3.1.5未登录词的处理

3.1.6汉语分词的难点

3.1.7汉语分词评测

3.2屈折语的词法分析

3.2.1屈折语的词法分析

3.2.2屈折语的词法分析技术

3.2.3词法分析的原因

3.2.4词法分析的程度

3.3日语分词

3.3.1日语词语特征

3.3.2日语分词的常用方法

3.3.3日语切词和词性标注

3.3.4日语开源切分和标注器

3.4本章小结

第4章词性标注

4.... 查看详情

查看详情