首页 > 图书中心 >图书详情

智能搜索:大数据搜索引擎原理及算法解析

搜索引擎行业编程人员掌握搜索引擎科技竞争力的实用工具书!

作者:沙芸
定价:69.80
印次:1-1
ISBN:9787302535508
出版日期:2019.11.01
印刷日期:2019.09.03

《智能搜索:大数据搜索引擎原理及算法解析》介绍大数据分布式搜索引擎开发原理与技术实现,主要内容包括多种语言的文本处理、分布式算法与代码实现、Elasticsearch的使用与原理等,通过一个医药领域垂直搜索引擎和电商搜索来说明如何开发实际的大数据智能搜索引擎。《智能搜索:大数据搜索引擎原理及算法解析》共分6章,第1章着重介绍开发智能搜索引擎可以采用的软硬件环境;第2~5章着重讨论构建分布式智能搜索引擎可能需要的多种语言文本处理方法,例如Kaldi语音识别实现和基于Raft共识协议的分布式计算平台实现;第6章介绍医药和电商搜索两个应用案例。 《智能搜索:大数据搜索引擎原理及算法解析》适合作为高等院校计算机、软件工程专业本科生、研究生的参考用书,对于对人工智能领域感兴趣的人士也有一定的参考价值。

more >

智慧生物与机器集群构建的搜索系统已进化成为强大的智能系统。搜索引擎服务早已成为人们生活中不可或缺的一部分。 搜索引擎技术有着悠久的发展历史。1990年以来,搜索引擎经历了从Archie那样的FTP文件搜索服务到谷歌网页搜索服务的转变。强化学习、深度学习等技术的发展为搜索引擎技术持续不断地注入新的活力。 本书共分6章:第1章介绍开发智能搜索引擎可以采用的软件和硬件基础;第2章介绍搜索引擎理解文本语义的一些方法;第3章介绍通过开发语音识别技术来索引音频信息的一种方法;第4章介绍使用Elasticsearch实现的大数据分布式搜索引擎;第5章介绍分布式计算平台中的共识算法和远程过程调用(RPC)框架;第6章介绍医药垂直搜索引擎和电商搜索的案例分析。 本书相关的参考软件和代码在读者QQ群(661922108)的附件中可以找到。一些具体的细节也可以在读者QQ群讨论。感谢早期合著者、合作伙伴、员工、学员、读者的支持。他们的支持给我们提供了良好的工作基础,就像玻璃容器中的水培植物一样,这是一个持久可用的成长基础。技术的融合与创新无止境,欢迎一起探索。 本书适合需要具体实现搜索引擎的程序员使用,对于信息检索等相关领域的研究人员也有一定的参考价值,同时猎兔搜索技术团队已经开发出以本书为基础的专门培训课程和商业软件。 参与本书编写的还有罗刚、张子宪、石天盈、张继红、刘晓波、叶虎、罗庭亮、柳若边,在此一并表示感谢。 作者

more >
扫描二维码
下载APP了解更多
图书分类全部图书
more >
  • 沙芸,北京石油化工学院信息工程学院计算机系副主任,工学博士,副教授,硕士生导师,IEEE会员,北京市拔尖人才。多年从事图像处理、模式识别、数据挖掘等领域的研究,主持北京市教委项目,参与多项国家自然基金等纵向课题,作为骨干参与多项横向课题。发表论文多篇,其中EI检索15篇,软件著作权一部。
  • 读者对象:
    《智能搜索:大数据搜索引擎原理及算法解析》适合作为高等院校计算机、软件工程专业本科生、研究生的参考用书

    ,对于对人工智能领域感兴趣的人士也有一定的参考价值。


    本书特点
    《智能搜索:大数据搜索引擎原理及算法解析》从搭建搜索集群框架基础开始,结合操作案例的演示,引导读者从零

    开始,一步步掌握分布式检索的原理和全过程。同时《智能搜索:大数据搜索引擎原理及算法解析》还为读者提供服

    务QQ群,为读者答疑解惑。
more >
  • 第1章 智能搜索引擎开发 1

    1.1 人工智能与智能搜索引擎 1

    1.2 Linux操作系统基础 2

    1.2.1 SSH远程登录 2

    1.2.2 Micro文本编辑器 4

    1.2.3 Linux Shell脚本基础 4

    1.2.4 Shell脚本 5

    1.2.5 AWK 8

    1.3 Java基础 8

    1.3.1 使用Ant 9

    1.3.2 使用Maven 11

    1.3.3 使用Gradle 13

    1.3.4 使用Groovy Shell 16

    1.3.5 使用JShell 17

    1.4 Python基础 17

    1.4.1 Windows下安装Python 17

    1.4.2 Linux下安装Python 17

    1.4.3 开发环境 18

    1.5 C#基础 19

    1.6 硬件基础 21

    1.7 本章小结 22

    第2章 搜索引擎理解语义 23

    2.1 处理文本 23

    2.2 基于文法的语言模型 24

    2.3 正则表达式查找文本 25

    2.4 中文词语切分与词性标注 27

    2.4.1 使用中文分词 28

    2.4.2 正向最大长度匹配法 30

    2.4.3 未登录串识别 31

    2.4.4 基本的N元模型 34

    2.5 隐马尔可夫模型 43

    2.5.1 数据基础 43

    2.5.2 维特比算法 44

    2.6 英文文本切分与标注 48

    2.6.1 句子切分 48

    2.6.2 标注词性 50

    2.7 命名实体识别 52

    2.7.1 人名识别 52

    ...

精彩书评more >

标题

评论

版权所有(C)2019 清华大学出版社有限公司 京ICP备10035462号 京公网安备11010802013248号

联系我们 | 网站地图 | 法律声明 | 友情链接 | 盗版举报 | 人才招聘