前.言
Python是目前热门的编程语言。它的优点是免费和开源。随着Python的不断发展,它已经在数据分析与数据可视化领域受到了众多学者和企业的关注,并且提供了很多丰富的库。本书重点研究如何使用Python中的库,与数据分析、数据可视化相结合,以便分析实际场景中的数据,挖掘数据中的信息。
本书分为3部分11章。其中,第1~3章是Python数据可视化基础篇,介绍了Python的使用,以及Numpy、Pandas、Matplotlib的使用;第4~7章是Python数据可视化提高篇,以经典的Python可视化库为基础,介绍了Python的Seaborn、plotnine、Networkx、igraph、plotly、Bokeh、pyecharts库中的数据可视化功能的应用;第8~11章是Python数据可视化分析实战篇,介绍了4个完整的数据可视化分析案例。
本书尽可能做到内容全面与循序渐进,其中程序代码通过Jupyter Notebook展示,并通过经典案例的可视化分析,使没有Python基础知识的读者也能看懂本书的内容。
第1章为Python快速入门。本章从通过Anaconda安装Python开始,介绍了Python的基础内容,以及Python中的控制语句与函数等的使用,最后介绍了数据可视化分析的基本流程、图表的类型等。
第2章为Numpy与Pandas的数据操作和可视化。本章介绍了Numpy和Pandas的使用,包括数据生成、读取、操作、变换等,以及Pandas中的数据可视化函数的使用。
第3章为Matplotlib数据可视化。本章介绍了Matplotlib的数据可视化功能,包括Matplotlib的数据可视化方式、Matplotlib的图表组成元素、可视化子图方式、库中常用的数据可视化函数,以及可视化三维图像等。
第4章为Python经典的静态数据可视化库。本章主要介绍了Python中两个经典数据可视化库——Seaborn与plotnine,并将这两个库中的函数与实际数据相结合,展示这两个库的数据可视化功能。
第5章为网络图可视化。本章主要介绍了Python中两个经典网络图可视化库——Networkx与igraph,主要内容包括如何设置网络图中的节点、边,以及网络图的布局等,并针对网络图中信息挖掘,介绍如何计算网络图中的最短路径,以及路径的可视化。
第6章为plotly交互式数据可视化。本章主要介绍了交互式数据可视化库——plotly,并根据不同类型可视化图像,介绍了plotly中的相关函数的使用。
第7章为Python其他交互式数据可视化库。本章主要介绍了Python中两个交互式数据可视化库——Bokeh和pyecharts,并介绍了如何使用这两个库中相关函数获得可交互的图表。
第8章为足球运动员数据可视化分析。本章使用了一个具体的数据集进行一个完整的数据可视化分析流程,主要内容包括数据获取、数据清洗与预处理、数据探索性可视化分析、数据建模可视化分析等。
第9章为抗乳腺癌候选药物可视化分析。本章使用了一个抗乳腺癌候选药物可视化分析案例,主要内容包括特征选择与可视化、回归分析与可视化、二分类模型与可视化。
第10章为时序数据的异常值检测和预测。本章主要介绍了一个真实的时序数据应用案例,主要内容包括时序数据的可视化分析、异常值检验与预测等。
第11章为中药材鉴别数据可视化分析。本章介绍了一个中药材鉴别数据可视化分析案例,主要内容包括使用聚类算法对数据进行无监督学习,使用分类算法对数据进行有监督学习,将数据主成分降维与标签传播算法相结合对数据进行半监督学习。
由于作者水平有限,编写时间仓促,书中难免存在疏漏和错误,敬请读者不吝赐教。
海南省自然科学基金资助(supported by Hainan Provincial Natural Science Foundation of China)项目批准号:822RC713
扫描以下二维码获取本书视频及附赠资源。
参考文献
...
程序与数据
...
配套PPT
...
配套视频
作者
2024年10月