搜索引擎与信息获取技术

作者:徐宝文

定价:18元

印次:1-2

ISBN:9787302061359

出版日期:2003.04.01

印刷日期:2003.12.08

图书责编:杨帆

图书分类:零售

电子书
在线购买
分享
内容简介
作者简介
前言序言
资源下载
查看详情 查看详情 查看详情

本书介绍在计算机网络的基础上,利用搜索引擎信息获取技术在信息的海洋中快速准确地检索想要的信息。

前言 进入21世纪,互联网技术的发展及其所催生的“新经济”在世界经济格局中所占的分量呈现大幅上升的趋势。互联网的发展和应用趋势也为越来越多的人所关注。近几年来搜索引擎与信息获取技术随着万维网(WWW)这种方便易用的媒体的普及而得到了迅速的发展。由于互联网技术开放性的特点,使得网上的信息越来越丰富,这一方面为用户获取信息提供了很大的便利,另一方面由于信息量的飞速增长,使得用户查找所需信息时犹如大海捞针。新的信息获取技术——搜索引擎技术应运而生,并得到了飞速发展。搜索引擎已经成为在互联网上仅次于电子邮件的第二大网络应用。 信息获取技术从出现到现在已经有20多年的历史。在WWW出现之前,信息获取技术的发展比较缓慢,主要应用在图书馆、科技信息研究等专业部门,涉及的用户相对较少。在WWW出现之后,基于WWW的信息获取技术——搜索引擎技术出现并得到迅速发展。由于互联网的开放性,使得搜索引擎可以面向普通用户,用户的需求推动其进一步发展。我国在信息获取领域起步较晚,在中文信息获取需求的驱动下,出现一些中文搜索引擎网站。但是从国内搜索引擎的应用效果和对搜索引擎技术的掌握上与发达国家比较,则仍然存在较大的差距,特别是在智能搜索引擎的开发、建设和应用水平方面差距更大。这种差距主要表现在两个方面:第一是搜索引擎的性能和搜索结果的质量与国外的搜索引擎相比存在很大的差距。这就是为什么国人在选择搜索引擎的时候普遍选择国外著名搜索引擎的缘故。第二是对搜索引擎与信息获取技术的掌握和应用上有待于提高和加强,应用人才急需培养,经验有待积累和总结。前者的改善应依靠于国内网络性能的整体改善和先进信息获取技术的应用;...

目录
荐语
查看详情 查看详情
第1章概述 1

1.1引言1

1.2信息获取与数据获取 2

1.3信息获取技术的发展 3

1.4信息获取基本概念 4

1.5信息获取系统的过去、

现在和将来 5

1.6信息获取的过程 6

1.7本书的结构 7

1.8本章小结10

第2章信息获取模型 11

2.1引言 11

2.2布尔模型 11

2.3向量模型 12

2.4概率论模型 14

2.5神经网络模型 16

2.6基于命题逻辑的模型及其应用… 18

2.6.1基本概念不相交及其

与向量模型的关系 19

2.6.2基本概念相交及其与布尔模型的关系 21

2.7本章小结 23

第3章标记语言与文本操作 24

3.1引言 24

3.2标记语言 24

3.2.1HTML语言 25

3.2.2XML语言 26

目录

搜索引擎与信息获取技术3.3文本预处理 29

3.3.1文本的词法分析 30

3.3.2中文分词技术 31

3.3.3无用词汇的删除 32

3.3.4词干提取技术 32

3.3.5索引词条的选择 37

3.3.6词典 37

3.4文档聚类 38

3.5文本压缩 39

3.5.1基本概念 39

3.5.2统计方法 40

3.5.3字典方法 41

3.5.4倒排文件压缩 42

3.5.5文本压缩方法比较 44

3.6本章小结 45

第4章索引和搜索 46

4.1引言 46

4.2倒排文件 47

4.2.1倒排文件的搜索 48

4.2.2倒排文件的构造 49

4.3后缀树与后缀数组 50

4.4布尔查询 52

4.5顺序查询... 查看详情

查看详情