图书目录

目.录

第一部分.Python数据可视化基础篇

第1章.Python快速入门........................2

1.1 安装Python …………………………………………………………………………2

1.1.1 安装Anaconda ………………………………………………………………2

1.1.2 安装Python库 ………………………………………………………………5

1.2 Python的基础知识 …………………………………………………………………5

1.2.1 列表 …………………………………………………………………………6

1.2.2 元组 …………………………………………………………………………8

1.2.3 字典 …………………………………………………………………………9

1.2.4 集合 …………………………………………………………………………10

1.2.5 字符串 ………………………………………………………………………11

1.3 Python的语法结构 …………………………………………………………………12

1.3.1 条件判断语句 ………………………………………………………………12

1.3.2 循环语句 ……………………………………………………………………13

1.3.3 try/except语句 ………………………………………………………………14

1.4 Python函数 …………………………………………………………………………15

1.4.1 函数 …………………………………………………………………………15

1.4.2 lambda函数 …………………………………………………………………16

1.5 数据可视化分析 ……………………………………………………………………16

1.5.1 什么是好的数据可视化 ……………………………………………………16

1.5.2 数据可视化图像的基本类型 ………………………………………………17

1.5.3 数据可视化分析基本流程 …………………………………………………18

1.5.4 Python进行数据可视化分析的优势 ………………………………………18

1.6 本章小结 ……………………………………………………………………………19

第2章 Numpy与Pandas的数据操作和可视化.............20

2.1 Numpy数据操作 ……………………………………………………………………21

2.1.1 生成数组的方式 ……………………………………………………………21

2.1.2 数组的基础操作 ……………………………………………………………23

2.1.3 Numpy的常用函数 …………………………………………………………27

2.2 Pandas数据的生成和读取 …………………………………………………………34

2.2.1 序列和数据表的生成 ………………………………………………………34

2.2.2 数据索引 ……………………………………………………………………36

2.2.3 数据读取 ……………………………………………………………………38

2.3 Pandas数据操作 ……………………………………………………………………39

2.3.1 数据表的合并 ………………………………………………………………39

2.3.2 数据表的转换 ………………………………………………………………40

2.3.3 数据表的聚合和分组计算 …………………………………………………42

2.3.4 处理时间数据 ………………………………………………………………43

2.4 Pandas数据可视化 …………………………………………………………………44

2.4.1 Pandas的数据可视化函数 …………………………………………………45

2.4.2 Pandas数据可视化实战 ……………………………………………………45

2.5 本章小结 ……………………………………………………………………………50

第3章 Matplotlib数据可视化.....................51

3.1 Matplotlib的两种数据可视化方式 …………………………………………………52

3.1.1 类似Matlab风格的数据可视化方式 ………………………………………52

3.1.2 面向对象风格的数据可视化方式 …………………………………………53

3.1.3 设置正确显示中文的方法 …………………………………………………55

3.2 Matplotlib的图表组成元素 …………………………………………………………57

3.2.1 plot函数的使用 ………………………………………………………………58

3.2.2 设置坐标系取值范围和类型 ………………………………………………60

3.2.3 设置坐标轴刻度标签 ………………………………………………………62

3.2.4 设置网格线和参考线 ………………………………………………………63

3.2.5 添加注释和文本、使用公式、设置图例 …………………………………64

3.3 Matplotlib可视化子图 ………………………………………………………………66

3.3.1 plt.axes函数设置子图位置 …………………………………………………66

3.3.2 plt.subplot函数创建网格子图 ………………………………………………67

3.3.3 plt.subplots函数创建网格子图 ……………………………………………70

3.3.4 plt.GridSpec函数对网格进行更复杂排列 …………………………………71

3.4 Matplotlib可视化函数 ………………………………………………………………72

3.4.1 类别比较图形可视化函数 …………………………………………………72

3.4.2 数据关系图形可视化函数 …………………………………………………78

3.4.3 数据分布图形可视化函数 …………………………………………………80

3.4.4 其他图形可视化函数 ………………………………………………………83

3.5 Matplotlib可视化三维图像 …………………………………………………………88

3.5.1 三维点图和三维线图 ………………………………………………………88

3.5.2 三维等高线图 ………………………………………………………………90

3.5.3 三维曲面图和曲线图 ………………………………………………………90

3.6 本章小结 ……………………………………………………………………………91

第二部分.Python数据可视化提高篇

第4章 Python经典的静态数据可视化库.................93

4.1 Seaborn数据可视化 …………………………………………………………………93

4.1.1 关系型数据可视化函数 ……………………………………………………95

4.1.2 分布型数据可视化函数 …………………………………………………101

4.1.3 分类型数据可视化函数 …………………………………………………105

4.1.4 热力图数据可视化函数 …………………………………………………108

4.1.5 网格数据可视化 …………………………………………………………110

4.2 plotnine数据可视化 ………………………………………………………………110

4.2.1 几何图层 …………………………………………………………………111

4.2.2 图表美化 …………………………………………………………………116

4.2.3 位置调整 …………………………………………………………………118

4.2.4 图像分面与子图 …………………………………………………………120

4.3 本章小结 …………………………………………………………………………124

第5章 网络图可视化........................125

5.1 网络图的形式 ……………………………………………………………………125

5.2 Networkx网络图可视化 …………………………………………………………126

5.2.1 Networkx生成网络图 ……………………………………………………126

5.2.2 Networkx设置节点和边 …………………………………………………132

5.2.3 Networkx设置布局方式 …………………………………………………135

5.2.4 Networkx可视化复杂网络图 ……………………………………………138

5.3 igraph网络图可视化 ……………………………………………………………143

5.3.1 igraph生成并可视化网络图 ………………………………………………143

5.3.2 igraph设置节点和边 ………………………………………………………145

5.3.3 igraph设置节点的布局方式 ………………………………………………148

5.3.4 igraph可视化特定的路线 …………………………………………………149

5.4 本章小结 …………………………………………………………………………152

第6章 plotly交互式数据可视化...................153

6.1 plotly简介 …………………………………………………………………………154

6.2 plotly数值型变量数据可视化 ……………………………………………………154

6.2.1 单个数值型变量数据可视化 ……………………………………………154

6.2.2 两个数值型变量数据可视化 ……………………………………………156

6.2.3 三个数值型变量数据可视化 ……………………………………………159

6.2.4 多个连续数值型变量数据可视化 ………………………………………163

6.3 plotly分类型变量数据可视化 ……………………………………………………167

6.3.1 单个分类型变量数据可视化 ……………………………………………167

6.3.2 多个分类型变量数据可视化 ……………………………………………168

6.4 plotly数值型和分类型变量数据可视化 …………………………………………171

6.4.1 单个数值型和单个分类型变量数据可视化 ……………………………171

6.4.2 多个数值型和单个分类型变量数据可视化 ……………………………173

6.4.3 单个数值型和多个分类型变量数据可视化 ……………………………177

6.5 plotly其他类型数据可视化 ………………………………………………………180

6.5.1 可交互网络图可视化 ……………………………………………………180

6.5.2 时序数据可视化 …………………………………………………………185

6.6 本章小结 …………………………………………………………………………186

第7章 Python其他交互式数据可视化库................187

7.1 Bokeh交互式数据可视化 ………………………………………………………187

7.1.1 Bokeh的简介与设置 ……………………………………………………187

7.1.2 Bokeh数据可视化 ………………………………………………………188

7.2 pyecharts交互式数据可视化 ……………………………………………………196

7.2.1 pyecharts的简介与设置 …………………………………………………196

7.2.2 pyecharts数据可视化 ……………………………………………………198

7.3 本章小结 …………………………………………………………………………211

第三部分.Python数据可视化分析实战篇

第8章 足球运动员数据可视化分析..................213

8.1 数据清洗与预处理 ………………………………………………………………214

8.2 数据探索性可视化分析 …………………………………………………………218

8.2.1 可视化分析足球运动员年龄与价值之间的关系 ………………………219

8.2.2 可视化分析足球运动员年龄和综合评分之间的关系 …………………224

8.2.3 可视化分析联盟和俱乐部的足球运动员信息 …………………………225

8.2.4 可视化分析多个变量之间的关系 ………………………………………231

8.2.5 与球场位置相关的数据可视化分析 ……………………………………233

8.3 数据降维可视化分析 ……………………………………………………………238

8.3.1 主成分降维 ………………………………………………………………238

8.3.2 可视化主成分得分 ………………………………………………………240

8.4 数据聚类可视化分析 ……………………………………………………………242

8.4.1 寻找合适的聚类数目 ……………………………………………………242

8.4.2 K均值聚类可视化 ………………………………………………………243

8.4.3 利用主成分特征进行聚类分析 …………………………………………244

8.5 本章小结 …………………………………………………………………………247

第9章 抗乳腺癌候选药物可视化分析.................248

9.1 数据特征探索性可视化分析 ……………………………………………………251

9.1.1 药物的性质特征探索性可视化分析 ……………………………………252

9.1.2 药物的生物活性探索性可视化分析 ……………………………………254

9.1.3 药代动力学性质和安全性探索性可视化分析 …………………………257

9.2 数据特征选择 ……………………………………………………………………257

9.2.1 根据回归互信息筛选特征 ………………………………………………257

9.2.2 通过随机森林回归模型选择特征 ………………………………………259

9.3 回归模型预测生物活性 …………………………………………………………260

9.3.1 建立多元线性回归模型 …………………………………………………262

9.3.2 建立支持向量机回归模型 ………………………………………………267

9.3.3 建立GBDT回归模型 ……………………………………………………268

9.4 分类模型预测药代动力学性质和安全性 ………………………………………269

9.4.1 心脏毒性预测 ……………………………………………………………270

9.4.2 遗传毒性预测 ……………………………………………………………273

9.5 本章小结 …………………………………………………………………………277

第10章 时序数据的异常值检测和预测.................278

10.1 时序数据探索性可视化分析 ……………………………………………………279

10.1.1 时序数据的分布情况可视化分析 ………………………………………280

10.1.2 时序数据的波动情况可视化分析 ………………………………………281

10.2 异常值检测 ………………………………………………………………………284

10.2.1 ADTK检测单列时序数据的异常值 ……………………………………284

10.2.2 ADTK检测多列时序数据的异常值 ……………………………………287

10.2.3 Prophet检测单列时序数据的异常值 …………………………………289

10.2.4 基于VAR模型检测多列时序数据的异常值 …………………………291

10.3 异常值预测 ………………………………………………………………………297

10.3.1 Prophet算法检测数据中的异常值 ……………………………………297

10.3.2 提取异常值数据特征 ……………………………………………………299

10.3.3 异常值预测分类模型 ……………………………………………………301

10.3.4 数据平衡后建立分类模型 ………………………………………………303

10.4 趋势预测 …………………………………………………………………………305

10.4.1 单变量预测的SARIMA模型 …………………………………………306

10.4.2 单变量预测的Prophet模型 ……………………………………………308

10.4.3 多变量预测的VAR模型 ………………………………………………310

10.5 本章小结 …………………………………………………………………………312

第11章 中药材鉴别数据可视化分析..................313

11.1 无监督学习算法鉴别中药材类别 ………………………………………………314

11.1.1 数据特征探索性可视化分析 ……………………………………………315

11.1.2 使用数据原始的特征进行聚类 …………………………………………317

11.1.3 使用数据降维后的特征进行聚类 ………………………………………320

11.2 有监督学习算法鉴别中药材产地 ………………………………………………324

11.2.1 不同产地的中药材特征可视化分析 ……………………………………325

11.2.2 利用选择的特征进行分类 ………………………………………………325

11.3 半监督学习算法鉴别中药材类别 ………………………………………………330

11.3.1 数据预处理和可视化分析 ………………………………………………330

11.3.2 数据主成分降维 …………………………………………………………332

11.3.3 使用标签传播算法进行分类 ……………………………………………334

11.3.4 半监督学习分类——利用SelfTrainingClassi.er ………………………336

11.4 本章小结 …………………………………………………………………………338