Python数据分析实战——从Excel轻松入门Pandas
从Excel角度学习Pandas数据分析技术,入门更轻松,学习更高效! 配套150个示例源代码,示例丰富,步骤详细,实操性强

作者:曾贤志

丛书名:清华开发者书库.Python

定价:79元

印次:1-2

ISBN:9787302602811

出版日期:2022.05.01

印刷日期:2023.09.05

图书责编:赵佳霓

图书分类:零售

电子书
在线购买
分享
内容简介
作者简介
前言序言
资源下载
查看详情 查看详情 查看详情

本书从零开始系统讲解了使用Pandas导入Excel数据,然后使用Pandas技术对数据做整理和分析,最后导出为不同形式的Excel文件。完整实现了数据的导入、处理、输出的处理流程。 全书共10章。第1章为Pandas数据处理环境的搭建,第2章为使用Pandas对Excel数据读取与保存,第3章介绍与Pandas底层数据相关的NumPy库,第4章介绍了Pandas中DataFrame表格的增、删、改、查等常用操作,第5章介绍了对Series与DataFrame两种数据的运算、分支、遍历等处理,第6章介绍了字符串的各种清洗技术,第7章介绍时间戳与时间差数据的处理,第8章介绍Pandas中分层索引及与索引相关的操作,第9章介绍了对数据的分组处理及做数据透视表处理,第10章介绍了表格的数据结构转换,以及多表读取与保存。书中包含相应示例,不仅可以学会理论知识还可以灵活应用。 本书可作为Excel爱好者和数据分析初学者的入门书籍,以及想提高数据分析效率,拓展数据分析手段相关人员的参考书籍。

曾贤志,Office技术培训专家,我要自学网专家讲师,特邀技术图书作者,擅长使用VBA、SQL、Power BI、Python等技术做数据分析。著有《Power Query For Excel让工作化繁为简》《加薪不加班:174个Excel函数案例闯职场》《从Excel到Python:用Python轻松处理Excel数据》等与数据分析相关的技术图书。

前言 Excel是一款非常流行的电子表格软件。它是一种很好的数据存储方式,同时也是一款强大的数据清洗、分析工具。任何事物有强就有弱。Excel本身已经内置了很多实用的功能,为什么还要选择Pandas工具来处理Excel数据呢? 首先,在Excel进行数据清洗时,如果工作重复度比较高,反复使用手动操作效率太低,不具有自动化功能。当然,也可以用Excel内置的VBA编程进行二次开发,解决自动化问题,但Pandas更胜一筹,其代码简洁,灵活性强,运算速度更快。 其次,Pandas是跨平台的,在不同的操作系统上均可以使用。即使没有安装电子表格软件,也可以使用。不但如此,Pandas还支持TXT、CSV、HTML和数据库等更多格式的数据获取方式。 那么,什么是Pandas?Pandas是Python中的一个数据分析包,是基于NumPy的(提供高性能的矩阵运算,这就标志着它的运算速度快)。并且Pandas提供了超强的数据清洗功能,可以用于数据挖掘和数据分析,可以说Pandas就是为数据分析而生的。 本书从学习Excel数据清洗的视角来学习Pandas,更易上手。很多时候,Pandas中编写的数据处理代码像Excel中的工作表函数公式一样,一条代码就能完成任务,优雅又简洁。 本书主要内容 第1章介绍Anaconda集成环境的安装,Jupyter Notebook的使用,以及Python语言的基础语法应用。 第2章介绍Pandas对Excel/CSV文件的读取与保存设置,并介绍Pandas的DataFrame和Series两大核心数据结构。 第3章介绍NumPy数...

课件下载

样章下载

暂无网络资源

扫描二维码
下载APP了解更多

目录
荐语
查看详情 查看详情

目录

第1章Pandas数据处理环境搭建

1.1Pandas环境配置

1.1.1安装Python发行版本Anaconda

1.1.2程序编写工具Jupyter Notebook

1.2Python基础操作

1.2.1变量

1.2.2注释

1.2.3代码缩进

1.2.4数据结构

1.2.5控制语句

1.2.6函数

第2章Pandas中数据的存取

2.1读取Excel文件数据

2.2读取CSV文件数据

2.3保存为Excel文件格式

2.4保存为CSV文件格式

2.5Pandas中表格的结构

2.5.1DataFrame数据结构

2.5.2Series数据结构

第3章NumPy数据处理基石

3.1NumPy的定义

3.2NumPy数组的创建与转换

3.2.1普通数组

3.2.2序列数组

3.2.3随机数组

3.2.4转换数组

3.3NumPy数组的预处理

3.3.1类型转换

3.3.2缺失值处理

3.3.3重复值处理

3.4NumPy数组维度转换

3.4.1数组维度转换

3.4.2数组合并

3.5Series数据的创建

3.6DataFrame表格的创建

3.6.1使用NumPy数组创建DataFrame表格

3.6.2使用Python列表创建DataFrame表格

3.6.3使用Python字典创建DataFrame表格

第4章表格管理技术 ...

本书是一本基础入门加实战的书籍,既有基础知识,又有丰富示例,包括详细的操作步骤,实操性强。本书对Pandas的基本概念讲解很详细,包括基本概念及代码示例。