图书目录

第1章数据仓库与数据挖掘概述1

1.1数据仓库的兴起1

1.1.1从数据库到数据仓库1

1.1.2从OLTP到OLAP3

1.1.3数据字典与元数据4

1.1.4数据仓库的定义与特点6

1.2数据挖掘的兴起7

1.2.1从机器学习到数据挖掘7

1.2.2数据挖掘的含义8

1.2.3数据挖掘与OLAP的比较8

1.2.4数据挖掘与统计学9

1.3数据仓库和数据挖掘的结合11

1.3.1数据仓库和数据挖掘的区别与联系11

1.3.2基于数据仓库的决策支持系统13

1.3.3数据仓库与商业智能14

习题16

第2章数据仓库原理17

2.1数据仓库结构体系17

2.1.1数据仓库结构17

2.1.2数据集市及其结构18

2.1.3数据仓库系统结构21

2.1.4数据仓库的运行结构22

2.2数据仓库的数据模型23

2.2.1星型模型24

2.2.2雪花模型25

2.2.3星网模型25

2.2.4第三范式26

2.3数据抽取、转换和装载27

2.3.1数据抽取27

2.3.2数据转换28

2.3.3数据装载30

2.3.4ETL工具31

2.4元数据32

2.4.1元数据的重要性32

2.4.2关于数据源的元数据33

2.4.3关于数据模型的元数据33

2.4.4关于数据仓库映射的元数据35

2.4.5关于数据仓库使用的元数据36

习题36

第3章联机分析处理38

3.1OLAP概念38

3.1.1OLAP的定义38

3.1.2OLAP准则39

3.1.3OLAP的基本概念42

3.2OLAP的数据模型43

3.2.1MOLAP数据模型43

3.2.2ROLAP数据模型45

3.2.3MOLAP与ROLAP的比较45

3.2.4HOLAP数据模型48

3.3多维数据的显示48

3.3.1多维数据的显示方法48

3.3.2多维类型结构49

3.3.3多维数据的分析视图50

3.4OLAP的多维数据分析52

3.4.1多维数据分析的基本操作52

3.4.2广义OLAP功能54

3.4.3多维数据分析实例56

3.5OLAP结构与分析工具58

  3.5.1OLAP结构58

  3.5.2OLAP的Web结构59

  3.5.3OLAP工具及评价61

习题63

第4章数据仓库设计与开发65

4.1数据仓库分析与设计65

4.1.1需求分析65

4.1.2概念模型设计67

4.1.3逻辑模型设计68

4.1.4物理模型设计73

4.1.5数据仓库的索引技术75

4.2数据仓库开发79

4.2.1数据仓库开发过程79

4.2.2数据质量与数据清洗85

4.2.3数据粒度与维度建模86

4.3数据仓库技术与开发的困难88

4.3.1数据仓库技术88

4.3.2数据仓库开发的困难92

习题93

第5章数据仓库管理和应用95

5.1数据仓库管理95

5.1.1用户使用数据仓库的管理95

5.1.2数据管理98

5.2数据仓库的决策支持与决策支持系统103

5.2.1查询与报表104

5.2.2多维分析与原因分析105

5.2.3预测未来106

5.2.4实时决策106

5.2.5自动决策107

5.2.6决策支持系统108

5.3数据仓库应用实例109

5.3.1航空公司数据仓库决策支持系统简例109

5.3.2统计业数据仓库系统114

5.3.3沃尔玛数据仓库系统116

习题118

第6章数据挖掘原理120

6.1知识发现过程120

6.1.1知识发现过程定义120

6.1.2数据挖掘对象121

6.1.3数据挖掘任务123

6.1.4数据挖掘分类125

6.1.5不完全数据处理127

6.1.6数据库的数据浓缩128

6.2数据挖掘方法和技术131

6.2.1归纳学习的信息论方法131

6.2.2归纳学习的集合论方法131

6.2.3仿生物技术的神经网络方法132

6.2.4仿生物技术的遗传算法133

6.2.5数值数据的公式发现133

6.2.6可视化技术134

6.3数据挖掘的知识表示134

6.3.1规则知识134

6.3.2决策树知识135

6.3.3知识基135

6.3.4神经网络的权值136

6.3.5公式知识136

6.3.6案例137

习题137

第7章信息论方法139

7.1信息论原理139

7.1.1信道模型和学习信道模型139

7.1.2信息熵和条件熵140

7.1.3互信息与信息增益141

7.1.4信道容量与译码准则142

7.2决策树方法143

7.2.1决策树概念143

7.2.2ID3方法基本思想144

7.2.3ID3算法145

7.2.4实例与讨论146

7.2.5C4.5方法148

7.3决策规则树方法151

7.3.1IBLE方法的基本思想151

7.3.2IBLE算法153

7.3.3IBLE方法实例155

习题161

第8章集合论方法163

8.1粗糙集方法163

8.1.1粗糙集概念163

8.1.2属性约简的粗糙集理论166

8.1.3属性约简的粗糙集方法172

8.1.4粗糙集方法的规则获取173

8.1.5粗糙集方法的应用实例174

8.2关联规则挖掘176

8.2.1关联规则的挖掘原理177

8.2.2Apriori算法的基本思想180

8.2.3Apriori算法程序183

8.2.4基于FP树的关联规则挖掘算法184

习题188

第9章公式发现189

9.1公式发现概述189

9.1.1曲线拟合与公式发现189

9.1.2启发式与数据驱动启发式191

9.2科学定律重新发现系统193

9.2.1BACON系统基本原理193

9.2.2BACON系统实例194

9.2.3BACON系统的进展196

9.3经验公式发现系统197

9.3.1FDD系统基本原理197

9.3.2FDD.1系统结构199

9.3.3FDD.1系统实例202

9.3.4FDD.2系统204

9.3.5FDD.3系统207

习题211

第10章神经网络与遗传算法213

10.1神经网络概念及几何意义213

      10.1.1神经网络原理213

      10.1.2神经网络的几何意义214

      10.1.3超曲面神经网络概念216

10.2感知机218

10.2.1感知机模型218

10.2.2感知机实例219

10.2.3感知机讨论220

10.3反向传播模型221

10.3.1BP网络结构221

10.3.2BP网络学习公式推导221

10.3.3实例分析226

10.4遗传算法228

10.4.1遗传算法基本原理229

10.4.2遗传算子231

10.4.3遗传算法简例 234

10.4.4遗传算法的特点236

10.5基于遗传算法的分类学习系统237

10.5.1概述237

10.5.2遗传分类学习系统GCLS的基本原理238

10.5.3遗传分类学习系统GCLS的应用242

习题243

第11章文本挖掘与Web挖掘245

11.1文本挖掘概述245

11.1.1文本挖掘的基本概念245

11.1.2文本特征的表示246

11.1.3文本特征的提取247

11.2文本挖掘248

11.2.1文本挖掘功能层次248

11.2.2关联分析248

11.2.3文本聚类249

11.2.4文本分类250

11.3Web挖掘251

11.3.1Web挖掘概述251

11.3.2Web内容挖掘253

11.3.3Web结构挖掘255

11.3.4Web应用挖掘258

习题261

第12章数据仓库与数据挖掘的发展262

12.1综合决策支持系统262

  12.1.1从管理科学到决策支持系统262

  12.1.2基于数据仓库的决策支持系统与传统决策支持系统的结合265

  12.1.3综合决策支持系统发展趋势268

12.2可拓数据挖掘270

  12.2.1可拓学基本原理270

  12.2.2从数据挖掘到可拓数据挖掘272

  12.2.3可拓数据挖掘理论272

12.2.4可拓数据挖掘实例274

习题277

参考文献278