首页 > 图书中心 >图书详情

信息检索与搜索引擎(微课版)

新一代智能信息检索系统教材

作者:闫琰、班晓娟、刘煜豪
丛书名:面向新工科专业建设计算机系列教材
定价:49
印次:1-1
ISBN:9787302660989
出版日期:2024.04.01
印刷日期:2024.04.09

为了让读者全面了解信息检索和搜索引擎的基本概念、原理和实现方法,以及相关的研究和应用领域,本书详细阐述了信息检索中的重要问题。 全书共分为3篇,涵盖信息检索和搜索引擎的各个方面: 第1篇(第1~3章)为基础篇,介绍信息检索和搜索引擎的基本概念、原理以及信息采集、文本转换方法;第2篇(第4~6章)为技术篇,涵盖索引创建、用户交互、检索模型与搜索排序等关键技术;第3篇(第7章和第8章)为应用篇,讨论搜索引擎评价和链接分析,展示搜索引擎在不同领域的应用和发展趋势。全书提供了大量应用实例,每章后均附有习题。 通过对这些方面的讲解,读者可以了解信息检索和搜索引擎的相关技术和方法,掌握它们的实现和应用,为信息处理提供更好的解决方案。

more >

前言 在信息时代,信息的处理和管理成为人们日常工作和生活中不可或缺的部分。尤其是人工智能背景下,信息检索和搜索引擎成为人们获取和处理信息的主要手段之一。本书旨在介绍信息检索和搜索引擎的相关技术和方法,帮助读者全面了解信息检索和搜索引擎的基本概念、原理与实现方法,以及相关的研究和应用领域。 本书共分为8章,内容涵盖了信息检索和搜索引擎的各个方面,包括信息采集、文本转换、索引创建、用户交互、检索模型与搜索排序、搜索引擎评价和链接分析等。第1章介绍了信息检索和搜索引擎的基本概念、发展历程以及应用场景。第2章涵盖了信息采集的基本方法和技巧,包括爬虫流程、爬取策略、存储文档等方面的内容。第3章介绍了文本转换的基本方法和技术,包括文本表示、停用词去除、词干提取等。第4章讲述了索引创建的基本方法和技术,包括倒排索引、索引更新策略等。第5章介绍了用户交互的基本方法和技术,包括查询扩展、查询推荐、结果呈现等。第6章讲述了检索模型与搜索排序的基本方法和技术,包括向量空间模型、概率检索模型、机器学习排序模型等。第7章介绍了搜索引擎评价的基本方法和技术,包括相关性评价、检索效果评估等。第8章讲述了链接分析的基本方法和技术,包括PageRank算法、HITS算法等。 信息处理 与搜索引 擎课程 简介 本书结合了编者团队丰富的教学和实践经验,充分结合信息处理与搜索引擎知识点的特点,分为索引构建和查询处理两大组件详细介绍其功能结构。本书由闫琰担任主编,班晓娟、刘煜豪担任副主编。其中,第2~4章由曹欣参与编写,第5~8章由闵鹏浩参与编写。 本书旨在为读者提供全面而深入的信息检索和搜索引擎方面的知识,帮助读者掌握相关的技术和应用。我们相信,本书将成为信息检索和搜索引擎领域的重要参考书,也希望读者在学习本教材的过程中能够获得满意的收获。 在本书的编写过程中参考了国内外相关的文献资料,在此对文献的作者们表示衷心的感谢。由于编者的水平有限,书中难免存在疏漏和不足之处,恳请专家、同仁以及读者批评指正。 编者2024年1月

more >
扫描二维码
下载APP了解更多

同系列产品more >

并行程序设计

刘轶、杨海龙
定 价:69元

查看详情
Linux操作系统基础——面向人工智...

曹洁,张志锋,冯柳
定 价:59元

查看详情
人工智能应用的数学基础(微课版)

刘帅 付维娜 代建华
定 价:69元

查看详情
算法设计与问题求解(第2版·微课版)...

邓泽林、李峰
定 价:59元

查看详情
数据结构与问题求解(C++版·微课版)...

邓泽林、李峰
定 价:59元

查看详情
图书分类全部图书
more >
  • 本书结构清晰,分为基础篇、技术篇和应用篇,涵盖了信息检索和搜索引擎的各方面,从基本概念到专业技术,应有尽有。是一本理论与实践相结合的优秀教材,也是一本值得参考的信息检索和搜索引擎的专业指南。 

more >
  • 目录

    第1章信息检索和搜索引擎1

    1.1什么是信息检索1

    1.1.1Web搜索1

    1.1.2其他搜索应用2

    1.1.3其他信息检索应用3

    1.2搜索引擎架构3

    1.2.1搜索引擎3

    1.2.2基本的构件4

    1.3搜索引擎构件及其功能6

    1.3.1文本采集6

    1.3.2文本转换8

    1.3.3索引创建9

    1.3.4用户交互10

    1.3.5排序11

    1.3.6评价12

    1.4开源的搜索引擎系统13

    1.4.1Lucene13

    1.4.2Solr15

    1.4.3ElasticSearch15

    1.5搜索引擎面对的挑战15

    小结17

    习题17

    第2章信息采集18

    2.1网页18

    2.1.1网页的特点19

    2.1.2网页规模的估计20

    2.1.3网页的年龄21〖3〗信息检索与搜索引擎(微课版)目录〖3〗2.2网页爬虫23

    2.2.1网页爬虫的定义23

    2.2.2网页爬虫的执行流程23

    2.2.3设计网页爬虫的原则24

    2.2.4网页爬虫的评价指标25

    2.2.5爬取策略25

    2.2.6深网爬取27

    2.3网站地图27

    2.4非网页类信息采集28

    2.5存储文档29

    2.5.1形成摘要29

    2.5.2存储摘要29

    2.5.3文档更新31

    2.5.4网页去重和去噪31

    小结34

    习题35

    第3章文本转换37

    3.1文本的统计特征37

    3.1.1词频分布37

    3.1.2关联网页规模估计39

    3.2停用词去除40

    3.3词干提取41

    3.3.1基于规则的词干提取41

    3.3.2基于词典的词干...

精彩书评more >

标题

评论

版权所有(C)2023 清华大学出版社有限公司 京ICP备10035462号 京公网安备11010802042911号

联系我们 | 网站地图 | 法律声明 | 友情链接 | 盗版举报 | 人才招聘