Python数据挖掘技术及应用(第2版·微课版)
"内容系统全面:全面介绍数据挖掘的经典和主流算法。 原理浅显易懂:循序渐进阐述各类数据挖掘算法原理。 配套视频教程:提供配套视频讲解数据挖掘算法实现。 算法代码实现:使用Python 3.7.8实现书中所有算法。 配套资源丰富:配有教学课件、教案、大纲、数据集和源代码。"

作者:苏本跃,曹洁

丛书名:清华开发者书库.Python

定价:79元

印次:2-1

ISBN:9787302684008

出版日期:2025.04.01

印刷日期:2025.03.21

图书责编:杨帆

图书分类:教材

电子书
在线购买
分享
内容简介
作者简介
前言序言
资源下载
查看详情 查看详情 查看详情

本书是一本全面介绍数据挖掘技术的专业书籍,系统地阐述了数据挖掘的相关概念、原理、算法思想和算法的Python代码实现。全书共分为15章,各章相对独立成篇,以利于读者选择性学习。15章内容分别为绪论、NumPy科学计算库、pandas数据分析库的数据结构、pandas数据读写与可视化、pandas数据整理、pandas数据分析、决策树分类、贝叶斯分类、支持向量机分类和K近邻分类、神经网络分类、回归、聚类、关联规则挖掘、推荐系统、电商评论网络爬取与情感分析等内容。 本书可作为高等院校各专业的数据挖掘、数据分析课程教材,也可作为数据挖掘、数据分析人员的参考书。

曹洁,讲师,硕导,同济大学博士毕业,主要研究方向:并行分布式处理,大数据技术,机器学习。近年来,主持河南省省科技公关项目1项,参与国家自然科学基金项目3项,参与省科技进步三等奖1项,以第一作者在软件学报、计算机研究与发展等国内外SCI、EI期刊上发表论文6篇,已授权发明专利1项。在教学上以第2身份参与省教学改革项目3项,主持郑州轻工业大学青年教改项目1项,主编出版大数据技术、数据分析方面的教材11部,其中省部级规划教材5部。

前言 随着物联网、移动互联网、智能终端、Web 2.0、云计算和大数据等新兴信息技术的快速发展,以社交网络、社区、博客和电子商务为代表的新型应用得到广泛使用,这些应用不断产生大量的数据。人们往往期盼了解大数据中所隐含的有价值的知识和数据间有价值的潜在联系,“数据挖掘”是实现这些期盼的有力工具。 数据挖掘是一个在海量数据中利用各种分析工具发现模型与数据间关系的过程,它可以帮助决策者寻找数据间潜在的某种关联,发现被隐藏和被忽略的因素,因而被认为是在这个数据爆炸时代深层次认识数据、有效利用数据的一种有效方法。 Python具有开源、简洁易读、快速上手、多场景应用以及完善的生态和服务体系等优点,使其在挖掘领域中的地位显得尤为突出,Python已经当仁不让地成为数据挖掘人员的一把“利器”。 1. 本书编写特色  内容系统全面: 全面介绍了数据挖掘的经典和主流算法。  原理浅显易懂: 循序渐进地阐述了各类数据挖掘算法的原理。  配套视频教程: 提供配套视频讲解数据挖掘算法实现。  算法代码实现: 使用Python 3.7.x实现书中所有算法。 2. 本书内容组织 第1章 绪论。本章主要介绍什么是数据分析,什么是数据挖掘,数据挖掘的步骤,数据挖掘的典型应用和数据挖掘的主要挑战。 第2章 NumPy科学计算库。本章主要介绍ndarray多维数组,数组元素的索引、切片和选择,随机数数组,数组的运算,以及读写数据文件。 第3章 pandas数据分析库的数据结构。本章主要介绍Series结构,DataFrame结构,读取、修改和删除DataFrame的数据,以...

暂无课件

样章下载

暂无网络资源

扫描二维码
下载APP了解更多

目录
荐语
查看详情 查看详情
目录

第1章绪论1

1.1什么是数据分析1

1.2什么是数据挖掘1

1.3数据挖掘的步骤2

1.4数据挖掘的典型应用4

1.4.1市场营销4

1.4.2金融领域4

1.4.3医疗保健4

1.4.4社交媒体4

1.4.5教育领域4

1.5数据挖掘的主要挑战5

1.5.1数据规模大5

1.5.2高维数据5

1.5.3隐私安全5

1.5.4概念漂移5

1.5.5伦理问题5

习题6

第2章NumPy科学计算库7

2.1ndarray多维数组7

2.1.1创建ndarray数组7

2.1.2创建特殊的ndarray数组9

2.1.3ndarray对象的数据类型14

2.1.4ndarray对象的属性15

2.2数组元素的索引、切片和选择16

2.2.1索引和切片16

2.2.2选择数组元素的方法17

2.2.3ndarray数组的形状变换21

2.3随机数数组23

2.3.1简单随机数23

2.3.2随机分布24

2.3.3随机排列26

2.3.4随机数生成器27

2.4数组的运算28

2.4.1算术运算与函数运算28

2.4.2统计计算31

2.4.3线性代数运算33

2.4.4排序37

2.4.5数组拼接与切分38

2.5读写数据文件40

2.5.1读写二进制文件40

2.5.2读写文本文件41

习题42

第3章pandas数据分析库的数据结构43

3.1Series结构43

3.1.1创建Series43

3.1.2查看和修改Series对象的数据45

3.1.3Series对...

"本书选择的案例涵盖了主要的数据挖掘技术,给出的Python数据挖掘代码可以方便地复制或者改编后应用手自己的实际问题中,以该书作为基础进阶相当合适。
本书内容翔实,通俗易懂,涉及面广。对医工交叉和需要融合数据挖掘领域的读者而言,本书是一个难得的宝库,对培养新时期复合型创新人才很有帮助。
在数据挖掘领域,Pytnon是目前使用最广泛的編程语言。本书虽然定位为一本数据挖掘入门读物,但书中的数据挖掘与分析思想对其他行业来说也具备较高的参考价值。
"