首页 > 图书中心 > Python数据采集与分析(微课视频版)

前言

前言

在《“十四五”规划纲要》全文中,“数字”关键词出现了 75 处,“第五篇 加快数字化发展 建设数字中国”单独点题,强调要迎接数字时代,激活数据要素潜能,加快建设数字经济、数字社会等,以数字化转型整体驱动生产方式、生活方式和治理方式变革。因此,专业办学应主动对接产业数字化、数字产业化发展需求,瞄准未来前沿新格局,基于未来社会及行业发展需求原点,瞄准新业态,融入新技术,重视多学科交叉前沿理念,突出大数据智能化等在专业建设中的作用,推动传统专业建设与人才培养的转型与升级。

本书的出发点是对传统的教材进行结构优化及内容重组,并结合传统人文社科类专业数字化改造需求,聚焦数据分析中的Python数据采集与分析,让相关专业学生通过系统学习,具备一定的数字素养与解决实际问题的复合能力。

本书主要介绍了Python编程中常用到的数据类型及程序编写中的控制流程与设计逻辑,函数的创建与调用,常见编码类别及文件的读写与打开、关闭操作。在此基础上,以数据采集与分析为主线,介绍了网络爬虫原理与实现技术、Scrapy爬虫框架,以及numpy、pandas、matplotlib数据整理与分析工具包的应用,最后结合文本挖掘与分析,介绍了文本特征提取、文本分类及文本分析的原理与应用。

本书由王瑞胡和杨文艺任主编,谢壹、王春宝任副主编。第1~8章由王瑞胡编写,第9章和第13章由杨文艺编写,第10章和第11章由王瑞胡、谢壹共同编写,第12章由王瑞胡、王春宝共同编写,全书由王瑞胡完成统稿。

本书的出版得到重庆市2020年高等教育教学改革研究重点项目(项目编号: 202075)、重庆文理学院“合格+”多元人才培养试点项目(未来数字文旅创新人才培养实验班)等资助。在本书的编写过程中,参阅了Python数据采集与分析相关书籍、网上的一些资料和一些在线学习平台的课程,在此向这些文献资料的作者及团队表示感谢。

最后,特别感谢清华大学出版社的大力支持,使得本书得以顺利出版。

由于编者水平有限,书中难免有疏漏之处,敬请读者批评指正。

编者2023年6月

源码下载

版权所有(C)2023 清华大学出版社有限公司 京ICP备10035462号 京公网安备11010802042911号

联系我们 | 网站地图 | 法律声明 | 友情链接 | 盗版举报 | 人才招聘