首页 > 图书中心 > Python数据分析从入门到精通(第2版)

目录

第1篇 基础知识

第1章 数据分析基础 2

视频讲解:27分钟

1.1 数据分析概述 2

1.2 常见数据分析方法 3

1.2.1 对比分析法 3

1.2.2 同比分析法 4

1.2.3 环比分析法 4

1.2.4 回归分析法 5

1.2.5 聚类分析法 6

1.3 了解数据分析工具 6

1.4 数据分析的基本流程 7

1.4.1 确认目标 7

1.4.2 获取数据 8

1.4.3 处理数据 9

1.4.4 分析数据 10

1.4.5 验证结果 10

1.4.6 展示数据 10

1.4.7 应用数据 11

1.5 数据分析常用模块库 11

1.6 小结 12

第2章 搭建数据分析开发环境 13

视频讲解:19分钟

2.1 强大的编程语言Python 13

2.1.1 Python概述 13

2.1.2 安装Python 13

2.1.3 创建第一个Python程序 17

2.2 安装Anaconda开发环境 18

2.3 Jupyter Notebook开发工具 23

2.3.1 初识Jupyter Notebook 23

2.3.2 创建Jupyter Notebook文件 24

2.3.3 测试Jupyter Notebook 24

2.4 PyCharm集成开发环境 26

2.4.1 PyCharm的下载与安装 26

2.4.2 配置PyCharm 29

2.4.3 测试PyCharm 30

2.5 小结 32

第3章 NumPy模块之数组计算 33

视频讲解:265分钟

3.1 NumPy模块概述 33

3.1.1 什么是NumPy模块 33

3.1.2 安装NumPy模块 34

3.1.3 NumPy的数据类型 35

3.1.4 ndarray()数组对象 36

3.1.5 dtype数据类型对象 37

3.2 创建数组 37

3.2.1 创建简单的数组 38

3.2.2 多种创建数组的方式 39

3.2.3 根据数值范围创建数组 41

3.2.4 生成随机数组 43

3.2.5 在已有的数组中创建数组 45

3.3 数组的基本操作 49

3.3.1 数组的多种运算方式 49

3.3.2 数组的索引和切片 51

3.3.3 数组的重塑 55

3.3.4 数组的增、删、改、查 57

3.4 矩阵的基本操作 59

3.4.1 创建矩阵 60

3.4.2 矩阵的运算 62

3.4.3 矩阵的转换 64

3.5 NumPy常用的数学运算函数 65

3.5.1 算术函数 66

3.5.2 舍入函数 67

3.5.3 三角函数 68

3.6 统计分析 69

3.6.1 求和函数sum() 70

3.6.2 平均值函数mean() 70

3.6.3 最大值与最小值函数max()、min() 71

3.6.4 中位数函数median() 71

3.6.5 加权平均函数average() 72

3.6.6 方差与标准差函数var()、std() 73

3.7 数组排序 73

3.7.1 sort()函数 73

3.7.2 argsort()函数 74

3.7.3 lexsort()函数 74

3.8 小结 75

第4章 Pandas模块基础 76

视频讲解:67分钟

4.1 安装Pandas模块 76

4.2 了解Pandas模块 78

4.3 Pandas模块的两大数据结构 79

4.3.1 Series()对象 79

4.3.2 DataFrame()对象 80

4.4 数据中的索引 82

4.4.1 什么是索引 82

4.4.2 Series()对象的索引 83

4.4.3 DataFrame()对象的索引 86

4.5 小结 88

第5章 Pandas模块之数据的读取 89

视频讲解:75分钟

5.1 读取文本文件中的数据 89

5.2 Excel文件的读取和写入 90

5.2.1 读取Excel文件中的数据 90

5.2.2 读取指定Sheet页中的数据 93

5.2.3 通过行列索引读取指定数据 93

5.2.4 将数据写入Excel文件中 95

5.3 CSV文件的读取和写入 96

5.3.1 读取CSV文件中的数据 96

5.3.2 将数据写入CSV文件中 98

5.4 读取HTML网页 99

5.5 读取数据库中的数据 101

5.5.1 读取MySQL数据库中的数据 101

5.5.2 读取MongoDB数据库中的数据 104

5.6 小结 108

第6章 Pandas模块之数据的处理 109

视频讲解:96分钟

6.1 数据抽取 109

6.1.1 抽取指定行数据 110

6.1.2 抽取多行数据 110

6.1.3 抽取指定列数据 111

6.1.4 抽取指定的行、列数据 112

6.2 数据的增、删、改、查 113

6.2.1 增加数据 113

6.2.2 按行增加数据 114

6.2.3 删除数据 115

6.2.4 修改数据 116

6.2.5 查询数据 117

6.3 数据的排序和排名 120

6.3.1 数据的排序 120

6.3.2 数据排名 123

6.4 小结 125

第7章 Pandas模块之数据的清洗 126

视频讲解:81分钟

7.1 缺失值的处理 126

7.1.1 了解数据中的缺失值 126

7.1.2 查看缺失值 127

7.1.3 处理缺失值 128

7.2 处理数据中的重复值 129

7.3 数据中异常值的检测与处理 130

7.4 数据中字符串的操作函数 131

7.4.1 字符串对象中的常见函数 131

7.4.2 替换字符串——replace()函数 133

7.4.3 数据切分——split()函数 134

7.4.4 判断字符串——contains()函数 135

7.5 数据转换 136

7.5.1 通过字典映射的方式实现数据转换——map()函数 136

7.5.2 数据分割——cut()函数 137

7.5.3 数据分类——get_dummies()函数 138

7.6 小结 139

第8章 数据的计算与格式化 140

视频讲解:54分钟

8.1 常见的数据计算函数 140

8.1.1 求和——sum()函数 140

8.1.2 求平均值——mean()函数 141

8.1.3 求最大值——max()函数 142

8.1.4 求最小值——min()函数 143

8.2 高级的数据计算函数 144

8.2.1 求取中位数——median()函数 144

8.2.2 求取众数——mode()函数 145

8.2.3 计算方差——var()函数 146

8.2.4 计算标准差——std()函数 147

8.2.5 计算分位数——quantile()函数 147

8.3 数据格式化 148

8.3.1 设置小数位数 149

8.3.2 设置百分比 150

8.3.3 设置千位分隔符 151

8.4 小结 151

第9章 数据统计及透视表 152

视频讲解:71分钟

9.1 数据的分组统计 152

9.1.1 分组统计——groupby()函数 152

9.1.2 分组数据的迭代 154

9.1.3 分组聚合运算——agg()函数 155

9.1.4 通过字典和Series()对象进行分组统计 156

9.2 数据移位 157

9.3 数据合并 158

9.3.1 数据合并——merge()函数 158

9.3.2 数据合并——concat()函数 162

9.3.3 最近合并——merge_asof()函数 163

9.4 数据透视表 165

9.4.1 pivot()函数 165

9.4.2 pivot_table()函数 166

9.5 小结 167

第10章 处理日期与时间 168

视频讲解:94分钟

10.1 日期数据的处理 168

10.1.1 日期数据的转换 168

10.1.2 dt()对象 170

10.1.3 获取指定日期区间的数据 171

10.1.4 按不同时期统计数据 172

10.2 日期范围、频率和移位 174

10.2.1 生成日期范围——date_range()函数 174

10.2.2 日期频率转换——asfreq()函数 176

10.2.3 日期移位——shift()函数 177

10.3 时间区间与频率转换 179

10.3.1 创建时间区间 179

10.3.2 区间频率转换 180

10.4 重新采样与频率转换 181

10.4.1 重新采样——resample()函数 181

10.4.2 降采样处理 182

10.4.3 升采样处理 183

10.5 移动窗口函数 184

10.5.1 将时间序列的数据汇总——ohlc()函数 184

10.5.2 移动窗口数据计算——rolling()函数 185

10.6 小结 187

第11章 Scikit-Learn机器学习模块 188

视频讲解:54分钟

11.1 Scikit-Learn概述 188

11.2 安装Scikit-Learn模块 189

11.3 线性模型 190

11.3.1 最小二乘法回归——LinearRegression对象 190

11.3.2 岭回归——Ridge对象 191

11.4 支持向量机 192

11.5 聚类 194

11.5.1 什么是聚类 194 

11.5.2 聚类算法 195

11.5.3 聚类模块 195

11.5.4 聚类数据生成器 197

11.6 小结 198 

第2篇 可视化图表

第12章 Matplotlib模块入门 200

视频讲解:162分钟

12.1 Matplotlib模块概述 200

12.1.1 了解Matplotlib模块 200

12.1.2 Matplotlib模块的安装 203

12.1.3 体验Matplotlib可视化图表 204

12.2 图表的基本设置 205

12.2.1 基本绘图——plot()函数 205

12.2.2 设置画布——figure()函数 207

12.2.3 设置坐标轴——xlabel()、ylabel()函数 208

12.2.4 设置文本标签——text()函数 211

12.2.5 设置标题和图例——title()、legend()函数 212

12.2.6 添加注释——annotate()函数 215

12.2.7 设置网格线——grid()函数 217

12.2.8 设置参考线——axhline()、axvline()函数 218

12.2.9 选取范围——axhspan()、axvspan()函数 219

12.2.10 图表的布局——tight_layout()函数 220

12.2.11 保存图表——savefig()函数 221

12.3 绘制常用的图表 221

12.3.1 绘制散点图——plot()、scatter()函数 221

12.3.2 绘制折线图——plot()函数 223

12.3.3 绘制柱形图——bar()函数 224

12.3.4 绘制直方图——hist()函数 226

12.3.5 绘制饼形图——pie()函数 228

12.3.6 绘制面积图——stackplot()函数 231

12.3.7 绘制箱形图——boxplot()函数 233

12.3.8 绘制热力图——imshow()函数 236

12.3.9 绘制雷达图——polar()函数 237

12.3.10 绘制气泡图——scatter()函数 239

12.3.11 绘制棉棒图——stem()函数 239

12.3.12 绘制误差棒图——errorbar()函数 240

12.4 小结 241

第13章 Matplotlib模块进阶 242

视频讲解:69分钟

13.1 图表的颜色设置 242

13.1.1 常用颜色 242

13.1.2 可识别的颜色格式 243

13.1.3 颜色映射 244

13.2 处理日期与时间 245

13.2.1 dates子模块 245

13.2.2 设置坐标轴日期的显示格式 246

13.2.3 设置坐标轴日期刻度标签 247

13.3 次坐标轴(双坐标轴) 248

13.3.1 共享x坐标轴——twinx()函数 248

13.3.2 共享y坐标轴——twiny()函数 249

13.4 绘制多个子图表 250

13.4.1 subplot()函数 250

13.4.2 subplots()函数 252

13.4.3 add_subplot()函数 253

13.4.4 子图表共用一个坐标轴 254

13.5 绘制函数图像 255

13.5.1 一元一次函数图像 255

13.5.2 一元二次函数图像 256

13.5.3 正弦函数图像——sin()函数 256

13.5.4 余弦函数图像——cos()函数 257

13.5.5 S型生长曲线——Sigmoid()函数 257

13.6 形状与路径 258

13.6.1 绘制形状——patches子模块 258

13.6.2 绘制路径——path子模块 259

13.6.3 绘制圆——Circle()对象 261

13.6.4 绘制矩形——Rectangle()对象 262

13.7 绘制3D图表 263

13.8 小结 264

第14章 Seaborn图表 265

视频讲解:50分钟

14.1 了解Seaborn图表 265

14.1.1 Seaborn概述 265

14.1.2 安装Seaborn模块 266

14.1.3 体验Seaborn图表 267

14.2 Seaborn图表的基本设置 267

14.2.1 设置背景风格 267

14.2.2 控制边框的显示方式 268

14.3 绘制常见图表 268

14.3.1 绘制散点图——replot()函数 268

14.3.2 绘制折线图——relplot()、lineplot()函数 269

14.3.3 绘制直方图——displot()函数 271

14.3.4 绘制条形图——barplot()函数 271

14.3.5 绘制线性回归模型——lmplot()函数 272

14.3.6 绘制箱形图——boxplot()函数 273

14.3.7 绘制核密度图——kdeplot()函数 274

14.3.8 绘制提琴图——violinplot()函数 275

14.4 小结 275

第15章 Plotly图表 276

视频讲解:57分钟

15.1 了解Plotly图表 276

15.1.1 安装Plotly模块 276

15.1.2 Plotly绘图原理及流程 277

15.1.3 Plotly图表的生成方法 278

15.2 绘制基础图表 280

15.2.1 绘制散点图与折线图——Scatter()对象 280

15.2.2 绘制柱形图与水平条形图——Bar()对象 281

15.2.3 绘制饼图与环形图——Pie()对象 283

15.3 设置图表 285

15.3.1 图层布局——Layout()对象 285

15.3.2 设置图表标题 286

15.3.3 设置文本标记 286

15.3.4 设置注释文本 287

15.4 统计图表 290

15.4.1 绘制直方图 290

15.4.2 绘制箱形图 291

15.4.3 绘制热力图 292

15.4.4 绘制等高线图 293

15.5 绘制子图表 294

15.5.1 绘制基本的子图表 294

15.5.2 自定义子图位置 295

15.5.3 子图可供选择的图形类型 296

15.6 三维图绘制 296

15.7 绘制表格 297

15.7.1 Table()对象 297

15.7.2 create_table()函数 299

15.8 小结 301

第16章 Bokeh图表 302

视频讲解:51分钟

16.1 了解Bokeh图表 302

16.1.1 安装Bokeh模块 302

16.1.2 词汇与接口说明 302

16.1.3 绘制第一张Bokeh图表 303

16.1.4 通过数据类型绘制图表 305

16.2 绘制常见图表 309

16.2.1 绘制散点图——circle()函数 309

16.2.2 绘制组合图表——line()、circle()函数 310

16.2.3 绘制条形图——vbar()函数 311

16.2.4 绘制饼(环)形图——wedge()、annular_wedge()函数 312

16.3 设置图表 313

16.3.1 图表布局——column()、row()、gridplot()函数 313

16.3.2 配置绘图工具 315

16.3.3 设置视觉属性 317

16.3.4 图表注释 319

16.4 图表可视化交互 323

16.4.1 微调器 323

16.4.2 选项卡 324

16.4.3 滑块功能 325

16.5 小结 326

第17章 Pyecharts图表 327

视频讲解:52分钟

17.1 了解Pyecharts图表 327

17.1.1 Pyecharts概述 327

17.1.2 安装Pyecharts模块 328

17.1.3 绘制第一张Pyecharts图表 329

17.1.4 Pyecharts函数的链式调用 329

17.2 Pyecharts图表的组成部分 330

17.2.1 主题风格——InitOpts()对象 331

17.2.2 图表标题——TitleOpts()对象 332

17.2.3 图例——LegendOpts()对象 334

17.2.4 提示框——TooltipOpts()对象 336

17.2.5 视觉映射——VisualMapOpts()对象 337

17.2.6 工具箱——ToolboxOpts()对象 339

17.2.7 区域缩放——DataZoomOpts()对象 341

17.3 绘制Pyecharts图表 342

17.3.1 绘制散点图——EffectScatter()对象 342

17.3.2 绘制折线图和面积图——Line()对象 343

17.3.3 绘制柱形图——Bar()对象 345

17.3.4 绘制饼形图——Pie()对象 346

17.3.5 绘制箱形图——Boxplot()对象 348

17.3.6 绘制词云图——WordCloud对象 349

17.3.7 绘制热力图——HeatMap()对象 350

17.3.8 绘制水球图——Liquid()对象 352

17.3.9 绘制日历图——Calendar()对象 352

17.4 小结 353

第3篇 项目实战

第18章 综合案例:股票数据分析 356

视频讲解:44分钟

18.1 概述 356

18.2 案例效果预览 356

18.3 案例环境 358

18.4 前期准备 359

18.4.1 安装第三方模块 359

18.4.2 新建Jupyter Notebook文件 359

18.4.3 导入必要的模块 361

18.4.4 获取股票历史数据 361

18.5 数据预处理 362

18.5.1 数据查看与缺失性分析 362

18.5.2 描述性统计分析 363

18.5.3 数据处理 364

18.5.4 异常值分析 364

18.5.5 数据归一化处理 365

18.6 数据统计分析 365

18.6.1 可视化股票走势图 365

18.6.2 股票收盘价格走势图 366

18.6.3 股票成交量时间序列图 367

18.6.4 股票涨跌情况分析图 367

18.6.5 股票k线走势图 368

第19章 综合案例:淘宝网订单分析 370

视频讲解:5分钟

19.1 概述 370

19.2 案例效果预览 371

19.3 案例环境 372

19.4 数据集介绍 372

19.5 前期准备 373

19.5.1 安装第三方模块 373

19.5.2 新建Jupyter Notebook文件 373

19.5.3 导入必要的模块 373

19.5.4 数据读取与查看 374

19.6 数据预处理 375

19.6.1 缺失性分析 375

19.6.2 描述性统计分析 375

19.6.3 数据处理 376

19.7 数据统计分析 377

19.7.1 整体情况分析 377

19.7.2 按订单类型分析订单量 377

19.7.3 按区域分析订单量 378

19.7.4 每日订单量分析 380

19.7.5 小时订单量分析 380

第20章 综合案例:网站用户数据分析 382

视频讲解:32分钟

20.1 概述 382

20.2 案例效果预览 382

20.3 案例环境 383

20.4 MySQL数据 383

20.4.1 导入MySQL数据 383

20.4.2 Python连接MySQL数据库 384

20.5 实现过程 385

20.5.1 数据准备 385

20.5.2 数据检测 385

20.5.3 年度注册用户分析 385

20.5.4 新注册用户分析 387

第21章 综合案例:NBA球员薪资的数据分析 389

视频讲解:4分钟

21.1 概述 389

21.2 案例效果预览 389

21.3 案例环境 391

21.4 实现过程 391

21.4.1 数据准备 391

21.4.2 确定网页格式 392

21.4.3 Pandas爬取数据并保存 393

21.4.4 数据清洗 394

21.4.5 水平柱形图分析湖人队薪资状况 394

21.4.6 统计分析各个球队队员薪资总和 395

21.4.7 统计分析多个球队所有球员的薪资状况 397

21.4.8 分析不同位置球员的薪资状况 398

版权所有(C)2023 清华大学出版社有限公司 京ICP备10035462号 京公网安备11010802042911号

联系我们 | 网站地图 | 法律声明 | 友情链接 | 盗版举报 | 人才招聘