Python数据分析与挖掘实战
使用Python进行数据分析与数据挖掘

作者:邓立国

定价:79元

印次:1-3

ISBN:9787302577874

出版日期:2021.05.01

印刷日期:2025.02.08

图书责编:夏毓彦

图书分类:零售

电子书
在线购买
分享
内容简介
作者简介
前言序言
资源下载
查看详情 查看详情 查看详情

本书涵盖数据分析与数据挖掘的基础知识、必备工具和有效实践方法,能让读者充分掌握数据分析与数据挖掘的基本技能。 本书共分为15章,主要内容包括大数据获取、数据预处理、探索性数据分析、用Sklearn估计器分类、主流数据分析库、大数据的数据库类型、数据仓库/商业智能、数据聚合与分组运算、数据挖掘工具、挖掘建模、模型评估、社会媒体挖掘、图挖掘分类、基于深度学习的验证码识别、基于深度学习的文本分类挖掘实现。 本书采用理论与实践相结合的方式,利用Python语言的强大功能,以最小的编程代价进行数据的提取、处理、分析和挖掘,既适合Python数据分析与数据挖掘初学者、大数据从业人员阅读,也适合高等院校和培训机构大数据与人工智能相关专业的师生教学参考。

邓立国,东北大学计算机应用博士毕业。2005年开始在沈阳师范大学软件学院、教育技术学院任教,主要研究方向:数据挖掘、知识工程、大数据处理、云计算、分布式计算等。以第一作者发表学术论文30多篇(26篇EI),主编教材 1 部,主持科研课题6项,经费10余万元,多次获得校级科研优秀奖,作为九三社员提出的智慧城市提案被市政府采纳,研究成果被教育厅等单位采用。

前 言 在当今大数据驱动的时代,要想从事机器学习、人工智能、数据挖掘等前沿技术,离不开数据跟踪与分析,通过NumPy、Pandas等进行数据科学计算,通过Seaborn、Matplotlib等进行数据可视化展示,从实战的角度出发,让你在数据科学领域迈出重要的一步,开启数据分析与挖掘的开发之旅。目前数据分析与挖掘行业火爆,人才供不应求。机器学习、自然语言处理、数据可视化、数据探索、数据分析和数据挖掘,这些火热的前沿技术都是数据科学体系的范畴,是信息时代的高薪领域。而Python是用于数据分析与挖掘的必备工具! 大数据时代是海量数据同完美计算能力相结合的产物,确切地说是移动互联网、物联网产生了海量的数据,大数据计算技术完全胜任海量数据的收集、存储、计算、分析等问题。综合来看,未来几年大数据在商业智能、智慧城市和精准营销等领域的应用将发挥主导作用。 读者需要了解的重要信息 本书作为数据分析与挖掘专业的图书,介绍数据挖掘的算法流程、必备工具和实践方法,案例采用Python3来实现。本书涵盖从数据获得到数据处理和结果展示输出的全过程,以数据分析与挖掘五大环节(数据采集、数据预处理、探索分析、挖掘建模、模型评估)为轴线,理论与实践相结合,所有案例均具有代表性,明确了数据分析与挖掘目标及完成效果。分析挖掘的基本任务是从数据中提取商业价值,具体涵盖分类和预测、聚类分析、关联规则、时序模式、偏差检验、智能推荐等。 本书以真实案例驱动,配以分析用的数据与源代码,科学系统地介绍数据分析与挖掘建模领域的科学思维、必备知识、专业工具、完整流程以及编程技巧,让你能够快速胜任数据分析师岗位。...

课件下载

暂无样章

暂无网络资源

扫描二维码
下载APP了解更多

目录
荐语
查看详情 查看详情
目    录

第1章  大数据采集 1

1.1  大数据分类 1

1.2  大数据采集方法 2

1.3  Python爬虫 3

1.3.1  审查元素 4

1.3.2  认识网页结构 5

1.3.3  认识robots.txt的文档 6

1.3.4  爬虫的基本原理 11

1.3.5  Python爬虫架构 11

1.3.6  用GET方式抓取数据 12

1.3.7  用POST方式抓取数据 15

1.3.8  用Beautiful Soup解析网页 17

1.3.9  Python爬虫案例 19

1.4  本章小结 25

第2章  数据预处理 26

2.1  数据清洗 26

2.1.1  缺失值处理 27

2.1.2  异常值处理 28

2.2  数据集成 30

2.3  数据转换 32

2.4  数据规约 34

2.5  Python主要数据预处理函数 35

2.6  本章小结 37

第3章  探索性数据分析 38

3.1  异常值分析 38

3.2  缺失值分析 41

3.3  分布分析 43

3.4  相关性分析 46

3.5  对比分析 48

3.6  统计量分析 48

3.7  周期性分析 51

3.8  贡献度分析 51

3.9  Python主要数据探索函数 52

3.10  本章小结 53

第4章  Sklearn估计器 54

4.1  Sklearn概述 54

4.2  使用Sklearn估计器分类 58

4.2.1  k近邻算法 59

4.2.2  管道机制 63

4.2.3 ...

本书以数据分析与挖掘五大环节(数据采集、数据预处理、探索分析、挖掘建模、模型评估)为轴线,配以分析用的数据与源代码,系统地介绍数据分析与挖掘建模领域的科学思维、必备知识、专业工具、完整流程以及编程技巧,让你能够快速胜任数据分析师岗位。