首页 > 图书中心 >图书详情

搜索引擎与信息获取技术

作者:徐宝文
定价:18
印次:1-2
ISBN:9787302061359
出版日期:2003.04.01
印刷日期:2003.12.08

本书介绍在计算机网络的基础上,利用搜索引擎信息获取技术在信息的海洋中快速准确地检索想要的信息。

more >

前言 进入21世纪,互联网技术的发展及其所催生的“新经济”在世界经济格局中所占的分量呈现大幅上升的趋势。互联网的发展和应用趋势也为越来越多的人所关注。近几年来搜索引擎与信息获取技术随着万维网(WWW)这种方便易用的媒体的普及而得到了迅速的发展。由于互联网技术开放性的特点,使得网上的信息越来越丰富,这一方面为用户获取信息提供了很大的便利,另一方面由于信息量的飞速增长,使得用户查找所需信息时犹如大海捞针。新的信息获取技术——搜索引擎技术应运而生,并得到了飞速发展。搜索引擎已经成为在互联网上仅次于电子邮件的第二大网络应用。 信息获取技术从出现到现在已经有20多年的历史。在WWW出现之前,信息获取技术的发展比较缓慢,主要应用在图书馆、科技信息研究等专业部门,涉及的用户相对较少。在WWW出现之后,基于WWW的信息获取技术——搜索引擎技术出现并得到迅速发展。由于互联网的开放性,使得搜索引擎可以面向普通用户,用户的需求推动其进一步发展。我国在信息获取领域起步较晚,在中文信息获取需求的驱动下,出现一些中文搜索引擎网站。但是从国内搜索引擎的应用效果和对搜索引擎技术的掌握上与发达国家比较,则仍然存在较大的差距,特别是在智能搜索引擎的开发、建设和应用水平方面差距更大。这种差距主要表现在两个方面:第一是搜索引擎的性能和搜索结果的质量与国外的搜索引擎相比存在很大的差距。这就是为什么国人在选择搜索引擎的时候普遍选择国外著名搜索引擎的缘故。第二是对搜索引擎与信息获取技术的掌握和应用上有待于提高和加强,应用人才急需培养,经验有待积累和总结。前者的改善应依靠于国内网络性能的整体改善和先进信息获取技术的应用;而后者的改善则更多地依赖于人们对搜索引擎和信息获取技术的掌握。

more >
扫描二维码
下载APP了解更多
图书分类全部图书
more >
  • 第1章概述 1

    1.1引言1

    1.2信息获取与数据获取 2

    1.3信息获取技术的发展 3

    1.4信息获取基本概念 4

    1.5信息获取系统的过去、

    现在和将来 5

    1.6信息获取的过程 6

    1.7本书的结构 7

    1.8本章小结10

    第2章信息获取模型 11

    2.1引言 11

    2.2布尔模型 11

    2.3向量模型 12

    2.4概率论模型 14

    2.5神经网络模型 16

    2.6基于命题逻辑的模型及其应用… 18

    2.6.1基本概念不相交及其

    与向量模型的关系 19

    2.6.2基本概念相交及其与布尔模型的关系 21

    2.7本章小结 23

    第3章标记语言与文本操作 24

    3.1引言 24

    3.2标记语言 24

    3.2.1HTML语言 25

    3.2.2XML语言 26

    目录

    搜索引擎与信息获取技术3.3文本预处理 29

    3.3.1文本的词法分析 30

    3.3.2中文分词技术 31

    3.3.3无用词汇的删除 32

    3.3.4词干提取技术 32

    3.3.5索引词条的选择 37

    3.3.6词典 37

    3.4文档聚类 38

    3.5文本压缩 39

    3.5.1基本概念 39

    3.5.2统计方法 40

    3.5.3字典方法 41

    3.5.4倒排文件压缩 42

    3.5.5文本压缩方法比较 44

    3.6本章小结 45

    第4章索引和搜索 46

    4.1引言 46

    4.2倒排文件 47

    4.2.1倒排文件的搜索 48

    4.2.2倒排文件的构造 49

    4.3后缀树与后缀数组 50

    4.4布尔查询 52

    4.5顺序查询...

精彩书评more >

标题

评论

版权所有(C)2022 清华大学出版社有限公司 京ICP备10035462号 京公网安备11010802013248号

联系我们 | 网站地图 | 法律声明 | 友情链接 | 盗版举报 | 人才招聘