前言
自然语言处理(Natural Language Processing,NLP)指用计算机对自然语言信息进行处理的方法和技术。
NLP技术的典型应用包括自动语音识别(Automatic Speech Recognition)、机器翻译(Machine Translation)、自动摘要(Text Summarization)、信息抽取(Information Extraction)、情感分析(Sentiment Analysis)、聊天机器人(Chatter Bot)等。
在包括自动语音识别、文本校对、机器翻译在内的一些自然语言处理应用中,出现越来越多的开源Python代码。
结合猎兔搜索在自然语言处理相关领域10多年的研发、实践和教学经验,本书尝试用易懂的方式介绍使用Python编程语言解决NLP相关问题。
本书第1章介绍开发自然语言处理应用可以采用的Python开发环境及其相关技术基础;第2章介绍中文分词原理与命名实体识别;第3章介绍文档分析及自动校对方法;第4章介绍文本相似度计算与文档排重;第5章介绍信息提取及关键词提取;第6章介绍自动摘要与评测;第7章介绍文本分类;第8章介绍情感分析;第9章介绍语音识别应用开发;第10章介绍聊天机器人开发;第11章介绍机器翻译及自动评价。
本书中的一些内容和现有的一些开源项目spaCy等共同成长和发展。本书相关的参考软件和代码在读者QQ群777171593的附件中可以找到。一些具体的细节也可以在读者QQ群或者微信群讨论。由于作者水平有限,错漏之处敬请直接和作者联系。
感谢早期合著者、合作伙伴、员工、学员、读者的支持,给我们提供了良好的工作基础。就像玻璃容器中的水培植物一样,这是一个持久可用的成长基础。技术的融合与创新无止境。欢迎一起探索。
随着可获得语音和文本数据的日益增多,自然语言处理技术在生产和生活中发挥越来越重要的作用。
本书适合需要具体实现自然语言处理应用的开发人员或者对人工智能等相关领域感兴趣的读者参考,同时猎兔搜索技术团队已经开发出本书配套的培训课程和商业软件。
编者