数据挖掘方法与应用
随书赠送教学课件和每章的案例数据,获取地址见书前言。教材服务QQ:1815317009。

作者:徐雪琪

丛书名:普通高等教育统计与大数据专业“十三五”规划教材

定价:55元

印次:1-5

ISBN:9787302550624

出版日期:2020.08.01

印刷日期:2024.07.29

图书责编:高屾

图书分类:教材

电子书
在线购买
分享
内容简介
作者简介
前言序言
资源下载
查看详情 查看详情 查看详情

《数据挖掘方法与应用》以应用为导向介绍数据挖掘的相关工具、理论和方法,包括数据挖掘概述、数据挖掘工具、数据与数据平台、数据预处理、关联分析、决策树、贝叶斯分类和神经网络。通过循序渐进地讲解数据挖掘可使用的工具、数据存储及分析环境、原始数据可能存在的问题及相应的预处理方法、数据挖掘经典算法等相关知识,使读者对数据挖掘有整体的认识和了解。此外,《数据挖掘方法与应用》以解决问题为目的,结合实例阐述了使用IBM SPSS Modeler和R软件进行数据挖掘的方法与步骤,便于读者更好地理解和掌握。 《数据挖掘方法与应用》可作为统计学、大数据等相关专业高年级本科生及硕士研究生数据挖掘课程的教材,也可作为其他数据挖掘爱好者的参考用书。

徐雪琪,经济学博士,浙江工商大学统计与数学学院副教授、硕士生导师。主要学习和研究领域有:社会经济统计与应用研究、数据挖掘、大数据。现为本科生讲授统计学原理、企业经济统计学、数据仓库与数据挖掘等课程;为研究生讲授数据挖掘实务、数据挖掘方法与应用等课程。

前 言 数据挖掘出现于20世纪80年代后期,随着信息化技术的持续发展,它不断汲取统计学、机器学习、数据库技术、人工智能、模式识别和数据可视化等多学科领域的知识,无可争议地成为当今利用大数据分析获取知识的核心利器。 本教材是浙江省“十三五”优势专业(经济统计学)、浙江省一流学科(统计学)、浙江省优势特色学科(统计学)的建设成果之一,具有以下显著特点: (1) 重视数据挖掘项目实现的整个流程,除了包含数据挖掘的经典理论与方法,还详细介绍了数据挖掘工具、挖掘的数据类型和存储环境、大数据平台及数据预处理方法。 (2) 重视数据挖掘理论和方法的基本思想,在不失严谨的前提下,略过了一些复杂程度高,但又不影响理解的数学推导,将各个知识点言简意赅地阐述透彻。 (3) 重视实际案例应用及实现,每类方法结合多个案例,以运用恰当的方法解决实际问题为导向,以培养分析问题能力为重点,详细介绍IBM SPSS Modeler和R软件的实现过程。 本教材共分为8章:第1章为数据挖掘概述,主要介绍数据挖掘的发展历程、相关技术与发展趋势等;第2~3章主要介绍数据挖掘工具、数据类型及数据平台;第4章介绍数据预处理相关技术;第5~8章介绍了各种数据挖掘经典算法原理、案例应用及实现。 本教材主要针对统计学、大数据相关专业的高年级本科生和硕士研究生编写,以学生深入理解并掌握数据挖掘的基本方法、了解相关的应用环境、熟练运用相关软件进行数据挖掘为目标,也可作为其他各专业读者学习数据挖掘方法与应用的教材或参考书。 本教材教学资源丰富,除了教学课件之外,还提供了每章的案例数据,读者可以通过ht...

暂无课件

样章下载

暂无网络资源

扫描二维码
下载APP了解更多

目录
荐语
查看详情 查看详情
目    录

 

第1章  数据挖掘概述  1

1.1  数据挖掘的产生与发展  1

1.1.1  数据挖掘概念的提出  2

1.1.2  数据挖掘系统的发展  3

1.1.3  当前热点和未来趋势  5

1.2  数据挖掘过程  10

1.2.1  Fayyad过程模型  10

1.2.2  CRISP-DM过程模型  11

1.3  数据挖掘功能与使用技术  21

1.3.1  数据挖掘功能  21

1.3.2  数据挖掘使用技术  22

1.4  数据挖掘应用  26

1.4.1  金融领域的数据挖掘  26

1.4.2  电信领域的数据挖掘  26

1.4.3  零售与电子商务领域的数据挖掘  27

1.4.4  政府政务领域的数据挖掘  27

1.4.5  医疗领域的数据挖掘  28

1.4.6  科学领域的数据挖掘  28

1.5  练习与拓展  28

第2章  数据挖掘工具  30

2.1  Weka  30

2.1.1  Weka简述  30

2.1.2  Weka运行界面  31

2.2  IBM SPSS Modeler  34

2.2.1  IBM SPSS Modeler简述  34

2.2.2  IBM SPSS Modeler主界面及功能  35

2.3  R语言  41

2.3.1  R语言简述  41

2.3.2  RStudio  42

2.3.3  R语言与数据挖掘  42

2.4  Python语言  45

2.4.1  Python语言简述  45

2.4.2  Py...

数据挖掘出现于20 世纪80 年代后期,随着信息化技术的持续发展,它不断汲取统计学、机器学习、数据库技术、人工智能、模式识别和数据可视化等多学科领域的知识,无可争议地成为当今利用大数据分析获取知识的核心利器。本教材是浙江省“十三五”优势专业(经济统计学)、浙江省一流学科(统计学)、浙江省优势特色学科(统计学)的建设成果之一,具有以下显著特点:
    (1) 重视数据挖掘项目实现的整个流程,除了包含数据挖掘的经典理论与方法,还详细介绍了数据挖掘工具、挖掘的数据类型和存储环境、大数据平台及数据预处理方法。
    (2) 重视数据挖掘理论和方法的基本思想,在不失严谨的前提下,略过了一些复杂程度高,但又不影响理解的数学推导,将各个知识点言简意赅地阐述透彻。
    (3) 重视实际案例应用及实现,每类方法结合多个案例,以运用恰当的方法解决实际问题为导向,以培养分析问题能力为重点,详细介绍IBM SPSS Modeler 和R 软件的实现过程。