





定价:128元
印次:1-1
ISBN:9787302573388
出版日期:2023.12.01
印刷日期:2023.12.27
图书责编:刘艳
图书分类:学术专著
计算语言学与自然语言处理的界限越来越模糊,学科融合的特点越来越明显,但作为技术应用的理论基础,计算语言学的研究对自然语言处理技术的发展尤为重要,该著市场需求旺盛。本著在介绍计算语言学基本方法、主要内容和应用领域的基础上,重点介绍计算语言学近年来的新发展和新趋势,适用于语言学、数学和计算机学科所有对自然语言处理感兴趣的读者。
张霄军,博士,西交利物浦大学翻译学科主管、英国利物浦大学客座讲师,社会兼职包括世界翻译教育联盟翻译技术教学研究会副会长等,研究兴趣为计算语言学、机器翻译和翻译技术。
前言 Grishman(1986;4)将“计算语言学”(computational linguistics)定义为“一门研究如何利用计算机来理解和生成自然语言的科学”。这指明了计算语言学的研究目标和研究手段。理解和生成自然语言,是计算语言学的研究目标;利用计算机,是计算语言学的研究手段。更确切地说,是“利用计算机建立传输说话者所表述和听话者所理解的信息的计算模型”(Hausser,2014:xix)。Allen(1995:3)则认为计算语言学的目标应该表述为:“利用计算机科学的算法和数据结构来建立语言的计算理论。” 要实现语言的生成,首先得要实现计算机对自然语言的理解。有人认为,现阶段提出理解目标不切实际,因为目前占主流地位的统计方法和深度学习的方法所达到的目标只是处理,还谈不上理解。更进一步说。并非经过理解才能处理。但是,统计方法只是解决问题的方法之一,它不能处理所有的语言问题;深度学习也不能真正理解语言,计算机所理解的人类语言不过是一种模仿或者复述。只有真正理解了人类语言,才能实现语言的生成。 要使计算机理解自然语言,必须使之具备以下自然语言知识(Allen,1995): ·语音和音系学知识:主要关注语音怎样转化为词; ·形态学知识:主要关注词素怎样构成词; ·句法知识:主要关注词怎样构成句子; ·语义知识:主要关注词义怎样构成句义; ·语用知识:主要关注句子在不同语境中的使用; ·语篇知识:主要关注上下句之间的关系; ·世界知识:主要指说话者和听话者所具备的对外部世界的认知。 通常来说,计算机要具备的自然语言知识似乎和传统语言学和现代...
第1章 词汇形态分析…………………………………………1
1.1 词与词汇形态学………………………………………2
1.1.1 词型与词例…………………………………………2
1.1.2 词汇形态学………………………………………3
1.2 词法分析……………………………………………4
1.3 词法分析技术研究综述及进展………………………5
1.3.1 词法分析器…6
1.3.2 词法分析研究进展………………………………9
1.4词法分析应用……………………………………11
第2章 汉语自动分词…………………………………………13
2.1 传统的汉语自动分词方法…………………14
2.1.1 最大匹配法…15
2.1.2 最大概率法……………………………………17
2.2 未登录词识别………………………………………20
2.2.1 姓名识别…………………………………………21
2.2.2 地名识别………………………………………22
2.2.3 机构名识别……………………………………24
2.2.4 新词识别………………………………………24
2.2.5 指代消解………………………………………25
2.3 切分歧义………………………………………………26
2.3.1 术语的辨析…27
2.3.2 交集型歧义切分的处理…………………………29
2.3.3 组合型歧义切分的处理………………………31
2.4 汉语自动分词研究进展………………………31
2.5 古汉语和中古汉语自动分词………………………35
第3章 自动词性标注...