前 言
为什么要写这本书?
数据时代下,数据将驱动很多领域产生有趣的新进展。数据的使用也变成了一个实
用的技能,不再仅限于计算机或统计学行业。在这个技术的推动之下,任何领域的人或
多或少都应该要培养数据的思考与使用能力。本书将以浅显易懂的内容与实务场景,逐
步培养数据开发者的相应技能。
本书采用Python作为主要的程序语言,Python语言拥有简单、易用、易上手、社区
资源丰富等优点,特别在数据分析这个领域,它有很多优秀的第三方套件,能够帮助开
发者专注项目本身。本书与其他图书的主要区别是,先系统分析几个数据分析中的主流
套件,再进一步将场景拉回实际应用。本书以数据分析的流程为主轴一步一步解析各个
环节,包括数据收集、数据前处理、特征工程、探索式分析等,让读者全面、深入、透
彻地理解Python的数据分析套件,并将其用于实际应用。
本书有何特色?
1. 涵盖Python用于数据分析的主流工具
本书涵盖了数据收集的Request、BeautifulSoup、Seleium套件,以及高效能的数学运
算工具NumPy、串起数据与程序分析的Pandas,还有用于视觉化呈现数据的Matplotlib。
2. 解析与深入探讨数据分析的步骤
本书将套件与工具应用到不同的使用情境,对数据收集、数据前处理、特征工程、
探索式分析等每个环节的实践内容进行深入探讨。