





定价:49元
印次:2-9
ISBN:9787302259138
出版日期:2011.11.01
印刷日期:2020.08.06
图书责编:杨帆
图书分类:教材
数据仓库与数据挖掘是决策支持的两项重要技术,它们共同的特点是都需要利用大量的数据资源,并从数据资源中提取信息和知识。由于数据资源丰富,因此数据仓库与数据挖掘的决策支持效果显著。 本书系统介绍数据仓库原理,联机分析处理,数据仓库设计与开发,数据仓库的决策支持,数据挖掘原理,基于信息论的决策树方法,基于集合论的粗糙集方法、K-均值聚类、关联规则挖掘,仿生物技术的神经网络,遗传算法,公式发现,知识挖掘,文本挖掘与Web挖掘。 本书从数据仓库的兴起来说明决策支持的特点,从数据挖掘的理论基础来说明数据挖掘的方法,并通过实例来详细讲解。希望读者在学习之后,亲自在计算机上去实践,这样才能更有效地掌握数据挖掘的方法。
第2版前言 数据仓库(Data Warehouse, DW)和数据挖掘(Data Mining, DM)是决策支持的两项重要技术。在数据仓库中利用多维数据分析来发现问题,并找出产生的原因,能从大量历史数据中预测未来;利用数据挖掘方法能从大量数据中获取知识。两项技术的共同特点是都需要利用大量的数据资源。 数据仓库和数据挖掘是在20世纪90年代中期兴起的,经过十多年的发展,在技术和应用两个方面都得到了很大的提高。为了提高数据仓库的决策支持效果,近年来开展了对综合数据的数据立方体的压缩技术研究,以及对多维数据分析的MDX语言的推广。本书第2版增加了这两项内容。为了强化数据挖掘中神经网络与遗传算法两项实用技术,在第2版中把它们独立列为两章。在神经网络中,按从易到难的顺序将内容重新安排了一下,并增加了径向基函数网络RBF的内容。在遗传算法中增加了进化计算的内容,以便扩大读者的视野。 本书仍保留了按数据仓库的形成过程来讲述其内容的方式,即从数据库到数据仓库以及对比,从联机事务处理OLTP到联机分析处理OLAP以及对比,用它们的对比来突出数据仓库决策支持的作用。按形成过程来讲述,既有利于掌握它们的连贯性,又有利于掌握数据仓库的新特点。 本书保留了依照数据挖掘的理论基础来讲述数据挖掘的方法:大家熟悉的决策树方法实质上是利用信息论中计算信息量的公式来选择属性构造决策树的结点;影响较大的粗糙集方法是典型的利用集合的覆盖原理;关联规则挖掘方法是对相关事务(项)的子集占整个集合的比例,大于阈值时建立关联规则的;在集合论方法中增加了影响最大的K-均值聚类方法。读者在懂得数据挖掘的方法的理论基础后...
1.1 数据仓库的兴起1
1.1.1 从数据库到数据仓库1
1.1.2 从OLTP到OLAP3
1.1.3 数据字典与元数据4
1.1.4 数据仓库的定义与特点6
1.2 数据挖掘的兴起7
1.2.1 从机器学习到数据挖掘7
1.2.2 数据挖掘含义8
1.2.3 数据挖掘与OLAP的比较8
1.2.4 数据挖掘与统计学9
1.3 数据仓库和数据挖掘的结合11
1.3.1 数据仓库和数据挖掘的区别与联系11
1.3.2 基于数据仓库的决策支持系统13
1.3.3 数据仓库与商业智能14
习题116
第2章 数据仓库原理18
2.1 数据仓库结构体系18
2.1.1 数据仓库结构18
2.1.2 数据集市及其结构19
2.1.3 数据仓库系统结构22
2.1.4 数据仓库的运行结构24
2.2 数据仓库数据模型24
2.2.1 星型模型25
2.2.2 雪花模型25
2.2.3 星网模型26
2.2.4 第三范式27
2.3 数据抽取、转换和装载28
2.3.1 数据抽取28
2.3.2 数据转换29
2.3.3 数据装载31
2.3.4 ETL工具32
2.4 元数据33
2.4.1 元数据的重要性33
2.4.2 关于数据源的元数据34
2.4.3 关于数据模型的元数据35
2.4.4 关于数据仓库映射的元数据35
2.4.5 关于数据仓库使用的元数据37
习题237
第3章 联机分析处理39
3.1 OLAP概念39
3.1.1 OLAP的定义39
3.1.... 查看详情