首页 > 图书中心 > 大数据分析:Python爬虫、数据清洗和数据可视化(第2版·微课视频版)

目录

源码下载

目录

第1章大数据

1.1大数据概述

1.1.1大数据介绍

1.1.2大数据的特征

1.1.3大数据技术基础

1.1.4大数据应用

1.2大数据的意义

1.2.1大数据的国家战略意义

1.2.2大数据的企业意义

1.2.3我国大数据市场的预测

1.3大数据的产业链分析

1.3.1技术分析

1.3.2运营分析

1.4本章小结

1.5实训

习题

第2章爬虫与大数据

2.1爬虫概述

2.1.1爬虫介绍

2.1.2爬虫的地位与作用

2.2Python介绍

2.2.1Python开发环境的搭建

2.2.2编写Python程序

2.2.3Python数据类型

2.3爬虫相关知识

2.3.1了解网页结构

2.3.2Python与爬虫

2.3.3基础爬虫框架

2.3.4正则表达式

2.4利用爬虫抓取网页内容

2.4.1观察与分析页面

2.4.2抓取过程分析

2.4.3获取页面内容

2.5本章小结

2.6实训

习题

第3章Scrapy爬虫

3.1Scrapy爬虫概述

3.2Scrapy原理

3.2.1Scrapy框架的架构

3.2.2Request对象和Response对象

3.2.3Select对象

3.2.4Spider开发流程

3.3Scrapy的开发与实现

3.3.1Scrapy爬虫的开发流程

3.3.2创建Scrapy项目并查看结构

3.3.3编写代码并运行爬虫

3.4本章小结

3.5实训

习题

第4章数据库连接与查询

4.1数据库

4.1.1数据库概述

4.1.2关系数据库设计

4.2MySQL数据库

4.2.1MySQL数据库概述

4.2.2MySQL数据库的下载、安装与运行

4.2.3MySQL数据库命令行入门

4.3使用Python操作MySQL数据库

4.3.1pymysql的安装与使用

4.3.2使用Python连接MySQL数据库

4.4本章小结

4.5实训

习题

第5章数据可视化基础与应用

5.1数据可视化

5.1.1数据可视化概述

5.1.2数据可视化工具

5.1.3数据可视化图表

5.2matplotlib可视化基础

5.2.1numpy库

5.2.2matplotlib的认识与安装

5.2.3matplotlib测试

5.2.4matplotlib.pyplot库

5.3matplotlib可视化绘图

5.3.1绘制线性图形

5.3.2绘制柱状图

5.3.3绘制直方图

5.3.4绘制散点图

5.3.5绘制极坐标图

5.3.6绘制饼图

5.4pyecharts可视化应用

5.5本章小结

5.6实训

习题

第6章大数据存储与清洗

6.1大数据存储

6.2数据清洗

6.2.1数据清洗概述

6.2.2数据清洗的原理

6.2.3数据清洗的流程

6.2.4数据清洗的工具

6.3数据标准化

6.3.1数据标准化的概念

6.3.2数据标准化的方法

6.3.3数据标准化的实例

6.4本章小结

6.5实训

习题

第7章数据格式与编码技术

7.1文件格式

7.2数据类型与编码

7.2.1数据类型概述

7.2.2字符编码

7.2.3数据转换

7.3Kettle数据清洗与转换工具的使用

7.3.1Kettle概述

7.3.2Kettle的安装与使用

7.4CSV格式的数据转换

7.4.1CSV格式概述

7.4.2CSV与JSON文件的转换

7.5本章小结

7.6实训

习题

第8章数据抽取与采集

8.1数据抽取

8.2文本抽取与实现

8.2.1文本文件的抽取

8.2.2CSV文件的抽取

8.2.3JSON文件的抽取

8.3网页数据抽取与实现

8.3.1网页数据抽取

8.3.2Excel抽取网页数据

8.3.3Kettle抽取网页数据

8.4数据采集与实现

8.5本章小结

8.6实训

习题

第9章pandas数据分析与清洗

9.1认识pandas

9.2pandas的语法与使用

9.3pandas读取与清洗数据

9.3.1数据准备

9.3.2从CSV中读取数据

9.3.3pandas数据清洗

9.4pandas数据可视化

9.4.1pandas绘图概述

9.4.2pandas绘图方法

9.5本章小结

9.6实训

习题

第10章综合实训

10.1数据清洗实训

10.1.1使用Kettle对生成的随机数实现字段选择

10.1.2使用Kettle连接不同的数据表

10.1.3使用Kettle过滤数据表

10.1.4使用Kettle连接MySQL数据库并输出查询结果

10.2数据分析实训

10.3本章小结

习题

参考文献

版权所有(C)2022 清华大学出版社有限公司 京ICP备10035462号 京公网安备11010802013248号

联系我们 | 网站地图 | 法律声明 | 友情链接 | 盗版举报 | 人才招聘