





定价:59元
印次:2-1
ISBN:9787302628323
出版日期:2023.03.01
印刷日期:2023.03.09
图书责编:闫红梅
图书分类:教材
本书对大数据挖掘与应用的基本算法进行了系统的介绍,每种算法不仅包括对算法基本原理的介绍,而且配有大量的例题以及基于阿里云大数据平台(数加平台)的演示,这种理论与实践相结合的方式极大地方便了读者对抽象的数据挖掘算法的理解和掌握。 本书共11章,内容覆盖了数据预处理、分类算法、聚类算法及常见的数据挖掘应用,具体章节包括大数据简介、数据预处理技术、逻辑回归方法、KNN算法、朴素贝叶斯分类算法、随机森林分类算法、支持向量机、 Kmeans聚类算法,以及社交网络分析方法及应用、文本分析方法及应用和推荐系统方法及应用等内容。 本书可作为高等院校数据挖掘课程的教材,也可作为数据挖掘及相关工程技术工作人员的参考书。
王振武,男,1978年9月生,籍贯山东青岛,中共党员,工学博士,副教授,硕士研究生导师,研究方向包括:数据挖掘、机器学习、计算智能等。负责和参与了国家重大科研专项、国家863项目、核工业预研项目、北京高校“青年英才计划”项目、中国矿业大学(北京)“越琦青年学者”项目、中央高校基本科研业务费项目,发表学术论文30余篇,SCI、EI收录20余篇,授权发明专利3项,申请软件著作权14项,参与撰写学术专著1部,在清华大学出版社等知名出版社出版教材10部,2015年获得年中国煤炭工业协会科学技术奖二等奖(排名第5),获得年国家安全生产监督管理总局安全生产科技成果一等奖(排名第6)。
前言 大数据泛指大规模、超大规模的数据集,因可从中挖掘出有价值的信息而备受关注。数据挖掘是一个涉及数据库技术、人工智能、统计学、机器学习等多个学科的领域,并且已经在各行各业有了非常广泛的应用。为适应我国数据挖掘的教学工作,作者在数据挖掘教学实践的基础上,参阅了多种国内外最近版本的教材,编写了本书。本书可以作为高等院校研究生的教材,也可以为相关行业的工程技术人员提供有益的参考。 本书内容循序渐进,对大数据挖掘的基本算法进行了详细的讲解。本书最大的特点是理论与实践相结合,算法理论与产业一线实践相结合,几乎所有的算法都配有实例和基于阿里云大数据平台(数加平台)的演示,这种理论与实际相结合的方法克服了只重理论、轻实践的内容组织方式,极大地方便了读者的理解。具体而言,本书11章内容之间的关系如下图所示。 本书提供的教学课件,读者可登录www.tup.com.cn网站自行下载。由于编者水平有限,书中必定存在不足之处,恳请专家和读者批评指正。 编者2023年1月
目录
第一篇基础篇
第1章大数据简介
1.1大数据
1.1.1大数据的定义
1.1.2大数据的特点
1.1.3大数据处理的挑战
1.2大数据挖掘
1.2.1大数据挖掘的定义
1.2.2大数据挖掘的特点
1.3大数据挖掘的相关方法
1.3.1数据预处理技术
1.3.2关联规则挖掘
1.3.3分类
1.3.4聚类
1.3.5孤立点挖掘
1.3.6演变分析
1.3.7特异群组分析
1.4大数据挖掘类型
1.4.1Web数据挖掘
1.4.2空间数据挖掘
1.4.3流数据挖掘
1.5大数据挖掘的常见应用
1.5.1社交网络分析
1.5.2文本分析
1.5.3推荐系统
1.6常用的大数据统计分析方法
1.6.1百分位
1.6.2皮尔森相关系数
1.6.3直方图
1.6.4T检验
1.6.5卡方检验
1.7常用的大数据挖掘评估方法
1.8大数据平台相关技术
1.8.1分布式存储技术
1.8.2分布式任务调度技术
1.8.3并行计算技术
1.8.4其他技术
1.9大数据平台实例——阿里云数加平台
1.9.1数加平台简介
1.9.2数加平台产品简介
1.9.3数加平台优势特色
1.9.4机器学习平台简介
1.9.5机器学习平台功能
1.9.6机器学习平台操作流程
1.10小结
思考题
第二篇技术篇
第...