首页 > 图书中心 > 数据分析与应用入门(Python版)

目录

目录

第1章数据分析简介

1.1开篇案例

1.2认识数据

1.2.1数据

1.2.2数据类型

1.3认识数据分析

1.3.1数据管理的产生和发展

1.3.2机器学习与人工智能

1.4数据分析步骤

1.5数据分析作用

1.6常用数据分析工具

1.7数据分析思维

小结

习题

第2章数据分析的方法

2.1针对现状分析的数据分析方法

2.1.1对比分析法

2.1.2分组分析法

2.1.3结构分析法

2.1.4平均分析法

2.1.5综合评价分析法

2.2针对原因分析的数据分析方法

2.2.1交叉分析法

2.2.2漏斗分析法

2.2.3矩阵关联分析法

2.2.4聚类分析法

2.2.5帕累托分析法

2.3针对预测分析的数据分析方法

2.3.1回归分析法

2.3.2时间序列分析法

2.3.3决策树分析法

2.3.4神经网络分析法

小结

习题

第3章NumPy和pandas基础

3.1NumPy基础

3.1.1ndarray数组的创建

3.1.2ndarray的常用属性

3.1.3ndarray的数据类型

3.1.4ndarray的算术操作

3.1.5ndarray的索引和切片

3.1.6对轴的理解

3.2pandas基础

3.2.1pandas数据结构

3.2.2索引重命名与重新索引

3.2.3数据基本操作

小结

习题

第4章数据获取与导入

4.1数据获取

4.2网络爬虫

4.2.1网页结构

4.2.2爬虫的流程

4.2.3爬虫Robots协议

4.3数据导入与导出

4.3.1一般文件

4.3.2CSV文件

4.3.3Excel文件

4.3.4JSON文件

4.3.5数据库

小结

习题

第5章数据预处理

5.1数据预处理的必要性

5.2数据清洗

5.2.1重复值检测与处理

5.2.2缺失值检测与处理

5.2.3噪声检测与处理

5.3数据集成

5.3.1实体识别问题

5.3.2数据列冗余问题

5.3.3数据值冲突问题

5.4数据规约

5.4.1策略概述

5.4.2属性子集选择

5.4.3抽样

5.5数据变换

5.5.1数据合并

5.5.2数据抽取

5.5.3数据计算

小结

习题

第6章数据探索

6.1基本统计描述

6.1.1集中趋势

6.1.2离散程度

6.1.3分布形状

6.2数据分组与聚合分析

6.2.1数据分组

6.2.2数据聚合

6.3交叉分析

6.3.1数据透视表

6.3.2数据交叉表

6.4参数估计及假设检验

6.4.1参数估计

6.4.2假设检验

6.5相关分析

6.5.1简单相关分析

6.5.2偏相关分析

6.5.3非参数相关分析

小结

习题

第7章数据挖掘概述

7.1什么是数据挖掘

7.2数据挖掘问题与任务

7.3分类分析

7.3.1预备知识

7.3.2解决分类问题的一般方法

7.3.3代表性方法之一: K最近邻算法

7.3.4评估分类器性能的度量

7.4关联分析

7.4.1购物篮分析

7.4.2频繁项集和关联规则

7.4.3基于Python的Apriori算法

7.4.4关联模式的评估

7.5聚类分析

7.5.1什么是聚类分析

7.5.2基本的聚类方法

7.5.3代表性方法之一: k均值

7.5.4聚类评估

小结

习题

第8章基本统计图形

8.1Matplotlib绘图

8.1.1图形基本设置

8.1.2基本统计图形

8.2pandas绘图

8.3Seaborn绘图

8.3.1单变量数据分布

8.3.2双变量数据分布

8.3.3多变量数据分布

小结

习题

第9章文本、网络和地理空间可视化

9.1文本可视化

9.1.1分词

9.1.2词云

9.2网络图可视化

9.2.1网络与图

9.2.2NetworkX绘图

9.3地理空间可视化

9.3.1GeoPandas和Basemap

9.3.2分级统计地图

9.3.3点描法地图

9.3.4带气泡的地图

小结

习题

参考文献

版权所有(C)2023 清华大学出版社有限公司 京ICP备10035462号 京公网安备11010802042911号

联系我们 | 网站地图 | 法律声明 | 友情链接 | 盗版举报 | 人才招聘