自然语言处理技术的产生可以追溯到20世纪50年代,它是一门集语言学、数学、计算机科学和认知科学等于一体的综合性交叉学科。近几年来,随着计算机网络技术和通信技术的迅速发展和普及,自然语言处理技术的应用需求急剧增加,人们迫切需要实用的自然语言处理技术来帮助人们打破语言屏障,为人际之间、人机之间的信息交流提供便捷、自然、有效的人性化服务。但是,自然语言处理中的若干科学问题和技术难题尚未得到解决,有待于来自不同领域的学者深入研究和探索。
中文信息处理作为自然语言处理中的一个分支,近几年来备受关注。一方面,随着中国经济的迅速发展和中国国力的不断增强,汉语正在成为一种新的强势语言而被世人瞩目,汉语理解所涉及的科学问题让国际计算语言学界无法回避;而另一方面,汉语使用者所拥有的巨大市场潜力令国际企业界不敢轻视。因此,中文信息处理成为全球自然语言处理研究者们共同关注的问题已经是不争的事实。目前国际上每年举行的颇具影响的几种技术评测,包括机器翻译评测、信息抽取评测和句法分析评测等,无不与汉语密切相关。因此,作为炎黄子孙,我们没有理由不在这一领域的研究中做出应有的贡献。
中文信息处理所面临的困难既有其他任何一种自然语言处理都会遇到的共性问题,如生词识别问题、歧义消解问题等,也有中文处理本身所具有的个性化问题,如汉语自动分词问题、词性定义规范问题等。因此,从某种意义上讲,中文信息处理更具挑战性。值得欣慰的是,中文信息处理在引起国际学术界和企业界关注的同时,得到了中国政府的重视和大力支持,它已经被列入国务院批准的“国家中长期科学技术发展规划纲要”。因此,中文信息处理面临着前所未有的大好机遇。
近几年来,我国的中文信息处理技术得到了快速发展,无论是在基础理论研究方面,还是在技术开发和产业化发展方面,都取得了显著成绩,一大批青年学者投身到这一领域中。为了使这一领域的广大学者,尤其是青年学生,全面了解中文信息处理的技术现状,进一步推动中文信息处理及其相关学科的快速发展,我们组织编写并出版了这套中文信息处理丛书,力求将这一领域的最新技术和理论方法全面、系统地介绍给广大读者。随着丛书的陆续出版,我们相信这套丛书必将在促进中文信息处理技术的发展和培养后继人才队伍方面发挥它应有的作用。
感谢清华大学出版社给予的支持。
