图书前言

前言

Python是大数据时代非常受欢迎的数据分析编程语言,近年来随着机器学习、云计算、人工智能等技术的发展,Python的流行趋势扶摇直上,已经成为数据分析和数据科学事实上的标准语言和标准平台之一。

本书针对数据分析人员和Python编程学习者进行内容编排和章节讲述,Python数据分析整个学习路线图计划分成16周,120天左右。本书主要内容包括以下五大部分。

(1) Python工作环境及基础语法知识: 认识Python程序运行方式,使用Python 3.5开发集成环境与工具; 学习Python程序基本结构,理解Python的面向对象定义和类、对象的操作方法,以及Python异常处理机制。本部分为基础内容,建议学习时间为4周。

(2) Python数据分析相关知识: Python生态系统为数据分析师和数据科学家提供了各种程序库,例如NumPy、SciPy、Pandas和Matplotlib,使其在数据分析领域也有广泛的应用。Python数据分析的学习主要是对相关库的使用,例如数据整理需要用到NumPy库,数据描述与分析则主要用到Pandas库。由于有前面的学习基础,本部分学习时间建议为3周。

(3) Python数据可视化: Python数据可视化的过程就是学习Matplotlib库的过程,Matplotlib库包含丰富的数据可视化资源,地图、3D等都有涉及,基于前面两部分的学习经验,这部分内容在两周内基本可以完成。

(4) Python机器学习: Scikitlearn是本书所使用的核心程序库,依托于上述几种工具包,封装了大量的经典以及最新的机器学习模型。通过介绍有监督和无监督机器学习原理,学习有监督学习的线性回归、Logistic回归、朴素贝叶斯、SVM、KNN和决策树等几个常用算法,以及无监督学习的KMeans聚类算法。在前面三部分学习的基础上,本部分内容建议学习时间在4周左右。

(5) Python地理空间数据分析应用: 向读者介绍地理空间分析的基本概念和常用的地理空间数据,然后介绍Python中与地理数据处理和地理分析相关的工具,最后以Python处理和分析矢量数据与栅格数据的方法,对浙江省实施的“五水共治”行动中劣五类水体在地理空间模型上分布的卫星图像数据进行可视化数据分析的综合应用,本部分内容建议学习时间为3周。

本书编写人员具有丰富的Python数据分析实践经验和多年的信息管理教学能力,第1~3章由沈阳工业大学李艺老师编写; 第4~7、10章由杭州电子科技大学柳毅老师编写; 第8、9、11、12章由杭州电子科技大学毛峰老师编写; 王健、陆佳涣等硕士研究生参与了本书相关章节内容和程序代码的完善工作; 浙江工业大学计算机科学与技术学院院长、国家教学名师王万良教授对本书进行了认真的审阅,并提出许多宝贵的建设性意见,使本书内容日臻完善,在此对他们所付出的辛勤劳动表示诚挚的感谢。

本书结合大数据管理与应用的最新发展,针对计算机科学与技术、信息管理与信息系统、电子商务等经管类本科教学特点进行撰写。本书提供教学课件、教学大纲、电子教案、习题答案和程序源码,读者可以扫描封底的课件二维码下载。本书还提供400分钟的视频讲解,扫描书中的二维码,可以在线观看。

由于编者水平所限,书中难免有疏漏之处,敬请读者批评指正。 

编者2019年3月