图书前言

前言

大数据泛指大规模、超大规模数据集,因可从中挖掘出有价值的信息而备受关注。数据挖掘是一个涉及数据库技术、人工智能、统计学、机器学习等多个学科的领域,并且已经在各行各业有着非常广泛的应用。为适应我国数据挖掘的教学工作,笔者在数据挖掘教学实践的基础上,参阅了多种国内外最新版本的教材,编写了本书。本书可以作为高等院校研究

生的教材,也可以为相关行业的工程技术人员提供有益的参考。

本书是教育部阿里云产学合作项目,在内容安排上循序渐进,对大数据挖掘的基本算法进行详细的讲解。本书的最大特点是理论与实践相结合,算法理论与产业一线实践相结合,全书几乎所有的算法都配有实例和基于阿里云数加平台的演示。这种理论与实践相结合的方法克服了重理论、轻实践的内容组织方式,极大地方便了读者的理解。具体而言,本书17章内容之间的关系如下图所示。

本书提供教学课件,读者可从www.tup.com.cn网站自行下载。由于编者水平有限,本书必定存在不妥和不足之处,恳请专家和读者批评指正。

编者

2017年3月