目 录
第一部分 •Microsoft Power BI之新手入门篇
第1章 商业数据分析及可视化概述 2
1.1 商业数据分析及其思维 2
1.2 商业数据分析基本流程 4
1.3 商业数据分析注意事项 6
1.4 商业数据可视化分析工具 7
1.4.1 Microsoft Power BI 7
1.4.2 Tableau Desktop 7
1.4.3 Smartbi Insight 8
1.4.4 Wyn Enterprise 8
1.4.5 QlikView 8
1.4.6 阿里DataV 9
1.4.7 腾讯TCV 9
1.4.8 百度Sugar 9
1.4.9 FineBI 9
1.5 Microsoft Excel数据可视化插件 10
1.5.1 Power Pivot 10
1.5.2 Power Query 11
1.5.3 Power View 12
1.5.4 Power Map 13
1.5.5 Plotly D3.js Charts 14
1.5.6 Office Apps Fiddle 15
1.6 案例数据集介绍 16
1.6.1 某客服中心数据集 16
1.6.2 某电商企业数据集 17
1.7 练习题 19
第2章 Microsoft Power BI软件初识 20
2.1 Microsoft Power BI软件概况 20
2.1.1 Microsoft Power BI Desktop 20
2.1.2 Microsoft Power BI服务 22
2.1.3 Microsoft Power BI报表服务器 22
2.1.4 Microsoft Power BI数据网关 22
2.2 Microsoft Power BI的下载与安装 23
2.2.1 安装前的注意事项 23
2.2.2 Microsoft Power BI的下载 23
2.2.3 Microsoft Power BI的安装 25
2.3 Microsoft Power BI软件简介 27
2.3.1 Microsoft Power BI主要界面 27
2.3.2 Microsoft Power BI三种视图 29
2.3.3 Microsoft Power BI数据类型 33
2.4 Microsoft Power BI报表编辑器 34
2.4.1 Microsoft Power BI“可视化”窗格 35
2.4.2 Microsoft Power BI“筛选器”窗格 36
2.4.3 Microsoft Power BI“字段”窗格 37
2.5 练习题 37
第3章 Microsoft Power BI连接各类数据源 38
3.1 连接单个数据文件 38
3.1.1 连接Excel文件 40
3.1.2 连接文本/CSV文件 42
3.1.3 连接XML文件 44
3.1.4 连接JSON文件 45
3.1.5 连接PDF文件 48
3.1.6 连接数据文件夹 49
3.2 连接到关系型数据库 53
3.2.1 连接Access数据库 53
3.2.2 连接SQL Server数据库 55
3.2.3 连接MySQL数据库 59
3.2.4 连接PostgreSQL数据库 64
3.2.5 连接Oracle数据库 68
3.3 连接到非关系型数据库 77
3.3.1 MongoDB简介 77
3.3.2 MongoDB的安装与配置 78
3.3.3 连接MongoDB的步骤 80
3.4 连接Web网页数据 84
3.5 练习题 86
第4章 Microsoft Power BI基础操作 87
4.1 数据可视化分析的基础操作 87
4.1.1 数据属性的操作 87
4.1.2 数据视图的操作 92
4.2 查询编辑器及其重要操作 95
4.2.1 查询编辑器简介 95
4.2.2 查询编辑器页面 97
4.2.3 调整数据类型 100
4.2.4 追加与合并数据 101
4.2.5 数据分类汇总 108
4.3 数据分析表达式DAX及其案例 109
4.3.1 DAX及其语法简介 109
4.3.2 DAX函数的主要类型 110
4.3.3 省份和城市的合成 112
4.4 创建和管理表之间的关系 114
4.4.1 表与表之间的关系类型 114
4.4.2 创建表之间的数据关系 114
4.4.3 管理表之间的数据关系 117
4.5 案例:统计局Web数据可视化分析 118
4.5.1 连接到Web数据源 119
4.5.2 调整和清理源数据 120
4.5.3 创建和发布可视化视图 127
4.6 练习题 128
第二部分 •Microsoft Power BI之可视化篇
第5章 Microsoft Power BI自带可视化视图 130
5.1 自带可视化视图概述 130
5.2 调整可视化对象元素 130
5.3 创建自带的可视化视图 135
5.3.1 堆积条形图:区域销售额的比较分析 135
5.3.2 簇状柱形图:客户不同支付渠道分析 137
5.3.3 分区图:不同类型客户的购买额分析 138
5.3.4 堆积面积图:不同区域的利润额分析 139
5.3.5 折线和堆积柱形图:月度销售业绩分析 140
5.3.6 瀑布图:不同区域销售额的比较分析 141
5.3.7 散点图:销售额和利润额的相关分析 142
5.3.8 饼图:不同区域销售额的占比分析 143
5.3.9 环形图:销售经理的销售业绩分析 144
5.3.10 树形图:不同省市的利润额分析 145
5.3.11 漏斗图:不同省市的销售额分析 146
5.3.12 仪表:订单商品的到货时间分析 147
5.3.13 卡片图:客户订单总金额的卡片图 149
5.3.14 KPI:客户每日客单价的走势分析 150
5.3.15 R视觉对象:订单金额的频数分析 151
5.3.16 Python视觉对象:指标相关分析 153
5.4 数据可视化的注意事项 156
5.4.1 选择合适的视觉对象 156
5.4.2 验证与事实是否一致 156
5.4.3 图表简单、充实、高效、美观 158
5.5 练习题 158
第6章 Microsoft Power BI自定义可视化视图 159
6.1 如何自定义可视化视图 159
6.2 下载可视化视图模板 160
6.3 导入可视化视图模板 162
6.4 固定可视化视图模板 165
6.5 创建自定义可视化视图 166
6.5.1 相关图:订货量、销售额、利润额的相关分析 166
6.5.2 聚类图:客户订单销售额与利润额的聚类分析 167
6.5.3 决策树:商品到货时间和折扣与退货的分析 167
6.5.4 方差图:实际到货时间与计划到货时间的分析 168
6.5.5 多折线图:不同类型商品销售额的折线图分析 169
6.5.6 点线图:企业每日销售额的走势分析 170
6.5.7 词云:企业热销商品类型的可视化分析 171
6.5.8 博彦日历:企业每日销售额总和日历图 172
6.5.9 阿斯特图:不同地区销售额的占比分析 173
6.5.10 阳光图:不同地区和商品类型的销售额分析 174
6.5.11 和弦图:不同区域的销售额比较分析 175
6.5.12 雷达图:实际到货时间与计划到货时间分析 176
6.5.13 直方图:商品订单金额的频数分布情况 177
6.5.14 子弹图:订单商品到货时间准时性分析 178
6.5.15 桑基图:不同地区的支付方式比较分析 179
6.5.16 龙卷风图:不同地区历史销售额的分析 180
6.6 练习题 181
第7章 Microsoft Power BI数据报表 182
7.1 Microsoft Power BI报表 182
7.1.1 Microsoft Power BI报表简介 182
7.1.2 Microsoft Power BI报表的特点 183
7.1.3 Microsoft Power BI报表与仪表板的差异 183
7.2 创建与发布Microsoft Power BI报表 184
7.2.1 为报表添加新的视图页面 184
7.2.2 为报表添加“筛选器”字段 186
7.2.3 发布与共享制作好的报表 188
7.3 报表设计的注意事项 190
7.3.1 合理布局报表视图页面 190
7.3.2 清楚准确地表达数据信息 192
7.3.3 报表外观舒适美观大方 194
7.4 练习题 194
第三部分 •Microsoft Power BI之大数据篇
第8章 连接Hadoop Hive 196
8.1 Hadoop简介 196
8.1.1 Hadoop分布式文件系统 197
8.1.2 MapReduce计算框架 197
8.1.3 Apache Hadoop发行版 198
8.2 连接基本条件 200
8.2.1 Hive版本:连接的必备条件 200
8.2.2 驱动程序:安装ODBC驱动 200
8.2.3 启动服务:运行Hive的服务 201
8.3 连接步骤:连接集群Hive 201
8.3.1 Cloudera Hadoop Hive 201
8.3.2 MapR Hadoop Hive 204
8.4 案例:不同地区销售额的比较分析 206
8.5 练习题 208
第9章 连接Apache Spark 209
9.1 Hadoop与Spark的比较 209
9.2 连接Hadoop Spark集群 211
9.2.1 安装Spark SQL的ODBC驱动 211
9.2.2 启动集群和Spark相关进程 212
9.2.3 配置Spark ODBC数据源 212
9.2.4 测试Spark ODBC数据连接 213
9.3 案例:比较企业各地区的销售业绩 214
9.4 练习题 217
第10章 连接Hadoop集群工具 218
10.1 DBeaver 218
10.1.1 安装和配置连接环境 218
10.1.2 不同职业客户平均年龄分布 223
10.2 Oracle SQL Developer 224
10.2.1 安装和配置连接环境 224
10.2.2 不同教育背景客户平均年龄分布 227
10.3 DbVisualizer 228
10.3.1 安装和配置连接环境 228
10.3.2 不同性别客户平均年龄分布 232
10.4 SQuirrel SQL Client 233
10.4.1 安装和配置连接环境 233
10.4.2 不同类型客户平均年龄分布 238
10.5 练习题 239
第四部分 •Microsoft Power BI之案例实战篇
第11章 案例实战——销售商品主题分析 242
11.1 准确了解电商商品现状 242
11.1.1 如何了解商品的现状 242
11.1.2 商品现状可视化分析 243
11.2 如何分析商品销售业绩 246
11.2.1 正确分析商品销售额 246
11.2.2 商品销售额可视化分析 247
11.3 练习题 250
第12章 案例实战——销售经理主题分析 251
12.1 销售经理销售业绩分析 251
12.1.1 如何考核销售经理 251
12.1.2 销售业绩可视化分析 251
12.2 销售经理服务满意度分析 254
12.2.1 影响服务满意度的因素 254
12.2.2 服务满意度可视化分析 254
12.3 练习题 257
第13章 案例实战——客户价值主题分析 258
13.1 电商商品有效客户分析 258
13.1.1 如何衡量客户价值 258
13.1.2 有效客户可视化分析 259
13.2 如何降低电商客户流失率 264
13.2.1 降低客户流失策略 264
13.2.2 客户流失率可视化分析 265
13.3 练习题 270
第14章 案例实战——配送准时性主题分析 271
14.1 电商商品配送准时性现状 271
14.1.1 商品配送流程与模式 271
14.1.2 配送准时性可视化分析 271
14.2 商品配送准时性与退单关系 277
14.2.1 影响配送准时性的因素 277
14.2.2 配送准时性与退单关系分析 277
14.3 练习题 281
第15章 案例实战——商品退货主题分析 282
15.1 电商商品退货现状分析 282
15.1.1 如何规避退单的发生 282
15.1.2 商品退货可视化分析 283
15.2 电商订单退货率分析 287
15.2.1 解读电商退货法规 287
15.2.2 商品退货率可视化分析 287
15.3 练习题 290
附录A 集群节点参数配置 291
A.1 Hadoop的参数配置 291
A.2 Hive的参数配置 293
A.3 Spark的参数配置 295
A.4 Zeppelin的参数配置 296
A.5 集群的启动与关闭 297
附录B 安装MongoDB 299
参考文献 303