





定价:99元
印次:1-2
ISBN:9787302632726
出版日期:2023.11.01
印刷日期:2024.10.23
图书责编:赵凯
图书分类:零售
本书从自然语言处理基础开始,逐步深入各种自然语言处理的热点前沿技术,使用了Java和Python两门语言精心编排了大量代码实例,契合公司实际工作场景技能,侧重实战。 全书共19章,详细讲解中文分词、词性标注、命名实体识别、依存句法分析、语义角色标注、文本相似度算法、语义相似度计算等内容,同时提供配套完整实战项目,例如对话机器人实战、搜索引擎项目实战、推荐算法系统实战。 本书理论联系实践,深入浅出,知识点全面。通过阅读本书,读者不仅可以理解自然语言处理知识,还能通过实战项目案例更好地将理论融入实际工作中。 本书适合自然语言处理的初学者阅读,有一定经验的算法工程师也可从书中获取很多有价值的知识,并通过实战项目更好地理解自然语言处理的核心内容。
陈敬雷 充电了么创始人,CEO兼CTO,中国首席数据官联盟专家委员。陈敬雷拥有十几年互联网从业经验,曾任架构师、首席技术官、首席科学家等职务,在技术领域,尤其在大数据和人工智能方向有着丰富的算法工程落地实战经验,其中在猎聘任职期间主导的推荐算法系统项目获得公司优秀项目奖,推荐效果得到5倍的提升。
前言 新型冠状病毒感染(COVID19)疫情是近百年来在世界上传播速度最快、感染范围最广、防控难度最大的突发公共卫生事件。在这次新冠疫情防控中,人工智能、大数据技术大显身手并得到了广泛应用,成为本次疫情防控中的一大亮点。人工智能技术这几年本来就很火,这次的新冠肺炎疫情更是加速了人工智能技术在各应用场景的工程落地速度,同时也掀起了大家学习人工智能技术的狂潮,很多公司对人工智能岗位的人才需求也因此增加,薪资也水涨船高! 自然语言处理(NLP)目前已成为人工智能领域最热门的技术之一,在公司的项目里有着非常广泛的应用场景。目前 NLP人才非常稀缺,招聘需求比较旺盛,薪资相对较高,在人工智能领域是一个非常好的就业方向。《自然语言处理原理与实战》 共19章,分别为自然语言处理技术概述、中文分词、词性标注、命名实体识别、依存句法分析、语义角色标注、文本相似度算法、语义相似度计算、词频逆文档频率(TFIDF)、条件随机场、新词发现与短语提取、搜索引擎Solr Cloud和Elasticsearch、Word2Vec词向量模型、文本分类、文本聚类、关键词提取和文本摘要、自然语言模型(language model)、分布式深度学习实战、自然语言处理项目实战(对话机器人项目实战、搜索引擎项目实战、推荐算法系统实战)等内容。 本书第1章主要介绍NLP的入门知识以及它在公司实际工作中的岗位技能要求、薪资水平及职业规划。 第2~6章介绍NLP的基础算法。第7章 介绍最热门的字符串编辑距离、余弦相似度。第8章讲解的语义相似度计算是语义热门技术同时也...
目录
第1章自然语言处理技术概述
1.1自然语言处理介绍
1.1.1自然语言处理的定义及其在实际工作中的定位
1.1.2自然语言处理的经典应用场景
1.2自然语言处理的技能要求和职业发展路径
1.2.1大数据部门组织架构和自然语言处理职位所处位置
1.2.2自然语言处理的职位介绍和技能要求
1.2.3自然语言处理的职业生涯规划和发展路径
1.2.4自然语言处理的市场平均薪资水平
第2章中文分词
2.1中文分词原理
2.2规则分词
2.2.1正向最大匹配法
2.2.2逆向最大匹配法
2.2.3双向最大匹配法
2.3机器学习统计分词
2.3.1隐马尔可夫模型分词
2.3.2感知器分词
2.3.3CRF分词
2.4分词工具实战
2.4.1CRF++工具包实战
2.4.2Python的Jieba分词
2.4.3Java的HanLP分词
2.4.4Java的IK分词
2.4.5Java的mmseg4j分词
第3章词性标注
3.1词性标注原理
3.1.1词性介绍
3.1.2HMM词性标注
3.1.3感知器词性标注
3.1.4CRF词性标注
3.2词性标注工具实战
3.2.1Python的Jieba词性标注
3.2.2Java的HanLP词性标注
第4章命名实体识别
4.1命名实体识别原理
4.2基于HMM角色标注的命名实体识别
4.2.1中国人名识别...
"