第1章 数据管理及分析软件 1
1.1 数据收集及管理 1
1.2 数据挖掘软件 6
1.3 习题 8
第2章 Python编程基础 10
2.1 Python简介 10
2.2 数据挖掘编程平台 13
2.3 Python基本语法 21
2.4 基本分析包 41
2.5 习题 54
第3章 Matplotlib数据可视化 55
3.1 Matplotlib基本参数配置 55
3.2 绘图参数文件及主要函数 62
3.3 Matplotlib基本绘图 70
3.4 Matplotlib绘图案例 94
3.5 习题 103
第4章 Seaborn数据可视化 105
4.1 Seaborn库简介 105
4.2 基本绘图参数设置 105
4.3 统计绘图函数 115
4.4 Seaborn可视化案例 132
4.5 习题 141
第5章 Pyecharts数据可视化 142
5.1 Pyecharts全局参数配置 142
5.2 数据系列配置 157
5.3 运行环境 173
5.4 习题 180
第6章 线性相关与回归分析 182
6.1 单变量线性相关与回归 182
6.2 多元线性相关与回归 190
6.3 综合案例:我国财政收入水平的区域差异分析 197
6.4 习题 204
第7章 数据压缩分析方法 205
7.1 主成分分析的概念 205
7.2 主成分的基本分析 211
7.3 综合案例 217
7.4 习题 224
第8章 聚类分析方法 227
8.1 聚类分析的概念 227
8.2 常见的聚类分析方法 230
8.3 综合案例 239
8.4 习题 250
第9章 时间序列分析方法 251
9.1 时间序列的概念 251
9.2 时间序列基本模型 252
9.3 ARIMA模型的构建 256
9.4 综合案例:社会消费品零售总额分析274
9.5 习题 286
第10章 大数据分析方法 287
10.1 大数据的概念及应用 287
10.2 文本挖掘基础 288
10.3 网络爬虫及应用 298
10.4 习题 314
第11章 综合案例实战 316
11.1 概述 316
11.2 基于国内旅游情况数据的可视化分析 321
11.3 基于广州市二手房房价的可视化分析 331
11.4 基于热销私家车销量数据的可视化分析345