数据挖掘出现于20 世纪80 年代后期,随着信息化技术的持续发展,它不断汲取统计学、机器学习、数据库技术、人工智能、模式识别和数据可视化等多学科领域的知识,无可争议地成为当今利用大数据分析获取知识的核心利器。本教材是浙江省“十三五”优势专业(经济统计学)、浙江省一流学科(统计学)、浙江省优势特色学科(统计学)的建设成果之一,具有以下显著特点:
(1) 重视数据挖掘项目实现的整个流程,除了包含数据挖掘的经典理论与方法,还详细介绍了数据挖掘工具、挖掘的数据类型和存储环境、大数据平台及数据预处理方法。
(2) 重视数据挖掘理论和方法的基本思想,在不失严谨的前提下,略过了一些复杂程度高,但又不影响理解的数学推导,将各个知识点言简意赅地阐述透彻。
(3) 重视实际案例应用及实现,每类方法结合多个案例,以运用恰当的方法解决实际问题为导向,以培养分析问题能力为重点,详细介绍IBM SPSS Modeler 和R 软件的实现过程。