图书目录

目  录

第一部分  大数据可视化基础

第1章  大数据可视化概述 2

1.1  大数据时代的技术挑战 2

1.2  数据可视化的技术难点 3

1.3  可视化工具的必备特性 4

第2章  搭建大数据开发环境 5

2.1  集群的安装及网络配置 5

2.1.1  Hadoop集群概述 5

2.1.2  集群软件及其版本 6

2.1.3  集群网络环境配置 8

2.2  集群案例数据集简介 10

2.2.1  数据字段说明 10

2.2.2  数据导入说明 12

2.2.3  运行环境说明 13

2.3  连接Hive的图形界面工具 13

2.3.1  DBeaver 13

2.3.2  Oracle SQL Developer 20

2.3.3  DbVisualizer 24

2.3.4  SQuirrel SQL Client 30

第3章  大数据可视化工具 38

3.1  Tableau 38

3.1.1  Tableau简介 38

3.1.2  Tableau连接Hive 39

3.1.3  Tableau连接Spark 44

3.2  Zeppelin 48

3.2.1  Zeppelin简介 48

3.2.2  Zeppelin连接Hive 48

3.2.3  Zeppelin连接Spark 55

3.3  Python在数据可视化中的应用 60

3.3.1  Python简介 60

3.3.2  Python连接Hive 61

3.3.3  Python可视化案例 62

第4章  Python可视化编程基础 65

4.1  Python环境安装 65

4.1.1  Anaconda 65

4.1.2  PyCharm 71

4.2  Python代码开发工具 80

4.2.1  Spyder 80

4.2.2  Jupyter Notebook 82

4.2.3  Jupyter Lab 86

4.3  Python连接数据源 90

4.3.1  连接单个文件数据 90

4.3.2  连接关系型数据库 97

4.3.3  连接Hadoop集群 101

第5章  Python数据可视化库 104

5.1  Matplotlib 104

5.1.1  Matplotlib库简介 104

5.1.2  Matplotlib可视化案例 104

5.2  Pyecharts 106

5.2.1  Pyecharts库简介 106

5.2.2  Pyecharts可视化案例 107

5.3  Seaborn 108

5.3.1  Seaborn库简介 108

5.3.2  Seaborn可视化案例 108

5.4  ggplot 110

5.4.1  ggplot库简介 110

5.4.2  ggplot可视化案例 111

5.5  Bokeh 113

5.5.1  Bokeh库简介 113

5.5.2  Bokeh可视化案例 113

5.6  Pygal 115

5.6.1  Pygal库简介 115

5.6.2  Pygal可视化案例 115

5.7  Plotly 117

5.7.1  Plotly库简介 117

5.7.2  Plotly可视化案例 117

5.8  其他可视化库 119

5.8.1  Altair 119

5.8.2  PyQtGraph 120

5.8.3  NetworkX 121

第二部分 Matplotlib数据可视化

第6章  Matplotlib图形参数设置 124

6.1  Matplotlib主要参数配置 124

6.1.1  线条的设置 124

6.1.2  坐标轴的设置 127

6.1.3  图例的设置 129

6.2  绘图参数文件及主要函数 132

6.2.1  修改绘图参数文件 132

6.2.2  绘图主要函数简介 133

6.3  Matplotlib参数配置案例 134

第7章  Matplotlib基础绘图 136

7.1  直方图的绘制 136

7.1.1  直方图及其参数说明 136

7.1.2  实例:每日利润额的数值分布 137

7.2  折线图的绘制 139

7.2.1  折线图及其参数说明 139

7.2.2  实例:每周商品销售业绩分析 139

7.3  条形图的绘制 141

7.3.1  条形图及其参数说明 141

7.3.2  实例:不同省份利润额的比较 141

7.4  饼图的绘制 143

7.4.1  饼图及其参数说明 143

7.4.2  实例:不同类型商品销售额比较 144

7.5  散点图的绘制 145

7.5.1  散点图及其参数说明 145

7.5.2  实例:销售额与利润额的关系 146

7.6  箱形图的绘制 148

7.6.1  箱形图及其参数说明 148

7.6.2  实例:销售经理业绩比较分析 149

第8章  Matplotlib高级绘图 151

8.1  树形图的绘制 151

8.1.1  树形图及其应用场景 151

8.1.2  实例:不同省份销售额的比较分析 151

8.2  误差条形图的绘制 153

8.2.1  误差条形图及其应用场景 153

8.2.2  实例:门店业绩考核达标情况分析 153

8.3  火柴杆图的绘制 155

8.3.1  火柴杆图及其应用场景 155

8.3.2  实例:不同省份送货准时性分析 155

8.4  甘特图的绘制 156

8.4.1  甘特图及其应用场景 156

8.4.2  实例:企业信息化项目进度管理 157

8.5  自相关图 160

8.5.1  自相关图及其应用场景 160

8.5.2  实例:股票价格的自相关分析 160

8.6  图形整合 163

8.6.1  图形整合及其应用场景 163

8.6.2  实例:区域销售额与利润额分析 164

第三部分  Pyecharts数据可视化

第9章  Pyecharts图形参数配置 168

9.1  全局配置项 168

9.1.1  基本元素配置项 168

9.1.2  坐标轴配置项 173

9.1.3  原生图形配置项 176

9.2  系列配置项 179

9.2.1  样式类配置项 179

9.2.2  标记类配置项 182

9.2.3  其他类配置项 185

9.3  运行环境 185

9.3.1  生成HTML 186

9.3.2  生成图片 186

9.3.3  Jupyter Notebook 187

9.3.4  Jupyter Lab 187

第10章  Pyecharts基础绘图 189

10.1  折线图的绘制 189

10.1.1  折线图及其参数配置 189

10.1.2  实例:各门店销售业绩比较分析 190

10.2  条形图的绘制 192

10.2.1  条形图及其参数配置 192

10.2.2  实例:各省市商品订单数量分析 194

10.3  箱形图的绘制 196

10.3.1  箱形图及其参数配置 196

10.3.2  实例:不同类型商品的收益分析 196

10.4  涟漪散点图的绘制 198

10.4.1  涟漪散点图及其参数配置 198

10.4.2  实例:不同收入等级客户价值分析 199

10.5  K线图的绘制 201

10.5.1  K线图及其参数配置 201

10.5.2  实例:企业股票价格趋势分析 201

10.6  双坐标轴图的绘制 203

10.6.1  双坐标轴图及其参数配置 203

10.6.2  实例:区域销售业绩及数量分析 203

第11章  Pyecharts高级绘图 206

11.1  日历图的绘制 206

11.1.1  日历图及其参数配置 206

11.1.2  实例:企业股票每日交易量分析 207

11.2  漏斗图的绘制 209

11.2.1  漏斗图及其参数配置 209

11.2.2  实例:华东地区各省市利润额分析 209

11.3  仪表盘的绘制 211

11.3.1  仪表盘及其参数配置 211

11.3.2  实例:企业2019年销售业绩完成率 211

11.4  环形图的绘制 213

11.4.1  环形图及其参数配置 213

11.4.2  实例:不同教育群体的购买力分析 213

11.5  雷达图的绘制 215

11.5.1  雷达图及其参数配置 215

11.5.2  实例:不同区域销售业绩的比较 216

11.6  旭日图的绘制 218

11.6.1  旭日图及其参数配置 218

11.6.2  实例:绘制我的家庭树旭日图 219

11.7  主题河流图的绘制 221

11.7.1  主题河流图及其参数配置 221

11.7.2  实例:不同类型商品销售情况分析 222

11.8  词云的绘制 224

11.8.1  词云及其参数配置 224

11.8.2  实例:商品类型关键词词云 224

11.9  玫瑰图的绘制 225

11.9.1  玫瑰图及其参数配置 225

11.9.2  实例:不同职业群体的购买力分析 226

第12章  Web端的数据可视化 228

12.1  搭建Django开发环境 228

12.1.1  Django框架简介 228

12.1.2  Django开发环境 229

12.2  Pyecharts与Django集成案例 230

12.2.1  创建项目运行环境 231

12.2.2  配置项目参数文件 232

12.2.3  测试项目运行效果 236

附录  集群各节点的参数配置 238

参考文献 246