大数据挖掘及应用(第2版)
提供课件、参考答案、程序、源码。国家级本科线上一流课程“大数据分析与处理”在线微视频开放课程配套教材 重庆市本科线上线下混合式一流课程“数据挖掘基础”配套教材

作者:王国胤、刘群、于洪、曾宪华、吴思远

丛书名:大数据系列丛书

定价:69.8元

印次:2-5

ISBN:9787302585701

出版日期:2021.10.01

印刷日期:2025.01.03

图书责编:张玥

图书分类:教材

电子书
在线购买
分享
内容简介
作者简介
前言序言
资源下载
查看详情 查看详情 查看详情

本书围绕大数据背景下的数据挖掘及应用技术,从大数据挖掘的基本概念入手,由浅入深、循序渐进地介绍大数据挖掘分析过程中的数据认知与预处理、数据可视化技术、数据挖掘的基本方法、Hadoop大数据分布式处理生态系统及分析应用等内容。其中数据挖掘的基本方法不仅包括数据关联分析、数据分类分析及数据聚类分析,还包括深度学习等重要的数据挖掘研究和发展主题。作者对每一章的内容都尽量从不同的角度进行深入剖析,案例均采用Python语言编程。 本书既可以面向计算机科学与技术、数据科学与技术、人工智能、智能科学与技术等信息类专业的本科生和研究生,也可以面向广大的IT从业人员。全书不仅提供了全部案例的Python源代码,还提供了丰富的习题和参考文献,对读者掌握大数据挖掘及应用领域的基本知识和进一步研究都具有参考价值。

王国胤,主编,主讲本科生及研究生课程多门。出版专著4部,主编教材1部。发表计算机教育教学论文7篇、科学研究论文300多篇。主持1项重庆市重大教改项目、1项国家自然科学基金重点项目、1项科技部重点研发计划和多项国家自然科学家基金面上项目

前言 本教材第1版于2017年7月由清华大学出版社正式出版发行。随后在重庆邮电大学经过3年的教学实践,根据各方反馈意见,并汇总读者的建议进一步修订完善,第2版最终于2021年金秋季节出版发行。 第2版基本沿用了第1版的叙述方式,继承并保留了总体结构。同时,在针对性、实用性和拓展性方面进行了删减和补充。与第1版相比,主要有以下几方面变化:  重写了多个章节的案例部分,这些案例都用Python语言实现,本书给出了案例的全部源代码。  更换了一些章节的实例和图表,如第2章的主成分分析实例,第4章的第一个引例,以及FPGrowth算法的实例等。  删除了第1版的第8章和第4章的第5小节,增加了第7章的第2小节,即前馈神经网络的介绍。  修正了多处排版问题及若干实质性错误。请此前版本的读者下载勘误表,并做相应的更正。 感谢我们的读者、学生及同行提出的宝贵意见,这些意见和建议成为本教材不断完善的保证。 本教材提供了丰富的教学资源,供教师教学和学生学习时使用。以本教材各章内容为基础的在线微视频开放课程“大数据分析与处理”是国家级精品在线开放课程,已经在高校邦、学银在线和重庆市高校在线开放课程平台网站上线,教师可以通过课前推送的方式指导学生观看相关视频,进行课前预习,其他读者可以通过该视频课程巩固和掌握各个知识点。除此之外,还提供了一些附加材料,包括每章的课件、涉及样例的完整程序、课后习题解答等,方便读者使用。 本教材第2版的第1、10章由王国胤和刘群编写,第2、4章由刘群编写,第3章由秦红星编写,第5、6章由于洪编写,第7章由曾宪华编写,第8、9章由吴...

课件下载

样章下载

暂无网络资源

扫描二维码
下载APP了解更多

目录
荐语
查看详情 查看详情
目录

第1章大数据挖掘及应用概论1

1.1大数据挖掘及应用的背景1

1.1.1从“小”到“大”的数据分析处理1

1.1.2大数据的智能分析与挖掘2

1.1.3大数据4

1.1.4云计算5

1.2大数据挖掘的发展及挑战7

1.2.1大数据的发展催生三元空间世界7

1.2.2大数据挖掘分析处理面临的挑战9

1.3数据挖掘概述11

1.3.1数据挖掘的概念11

1.3.2数据挖掘的功能11

1.3.3数据挖掘运用的技术13

1.3.4大数据挖掘与传统数据挖掘的关系13

1.3.5数据分析过程的5个原则14

1.4大数据挖掘分析处理框架15

1.4.1大数据挖掘计算平台框架16

1.4.2大数据挖掘处理流程20

1.5小结22

1.6习题23

1.7参考文献24

第2章数据认知与预处理25

2.1数据挖掘的定义和流程26

2.1.1如何理解和描述数据挖掘的问题26

2.1.2数据获取与准备27

2.1.3数据质量评估28

2.2数据类型28

2.2.1属性的定义29

2.2.2标称属性29

2.2.3二元属性30

2.2.4序值属性30

2.2.5数值属性30

2.3数据的统计描述方法30

2.3.1数据的中心趋势度量30

2.3.2数据的离散趋势度量32

2.4数据对象关系的计算方法35

2.4.1对象相似性计算方法35

2.4.2数据相关性计算方法42

2.5数据准备44

2.5.1数据清洗与集成44

2.5.2数据归约技术48

2.5... 查看详情

全书分导论、方法论和进阶应用三大部分,共10章,涵盖数据分析的数据预处理、关联规则分析方法、有标签的数据分析方法、无标签的数据分析方法、数据可视化技术、深度学习技术、Hadoop大数据分布式应用计算平台等基础知识。 

本书内容以大数据分析流程为导引,结合一系列案例和学生竞赛作品,将数据分析技术的应用过程,由浅入深地把理论融入实践,激发读者浓厚的学习热情,加深读者对知识的认识、理解和掌握。 

全书所有案例均采用Python语言编写,不仅包括简单程序的代码,也包括较大应用程序代码,所有代码都全部经过验证,适合初学者学习和实现。案例代码可以登录清华大学出版社网站(http://www.tup.com.cn)下载。 

可作为高等院校以及高职高专学校的计算机科学与技术、数据科学与技术、人工智能、智能科学与技术等相关信息类专业的教材,也可作为学习数据分析应用技术的参考书使用。

本书是国家级一流本科线上课程《大数据分析与处理》在线微视频开放课程的配套教材,也是重庆市一流本科线上线下混合式课程《数据挖掘基础》的配套教材。

查看详情