首页 > 图书中心 >图书详情
Python数据分析
作者: 曹洁 崔霄 等
丛书名:面向新工科专业建设计算机系列教材
定价:99元
印次:1-2
ISBN:9787302542858
出版日期:2020.06.01
印刷日期:2023.01.09
Python作为一种程序设计语言,凭借其简洁、易读及可扩展性日渐成为程序设计领域备受推崇的语言。同时,Python语言的数据分析功能也逐渐为大众认可。本书基于Python 3.6构建Python开发平台,全面涵盖Python基础编程知识;详解数据分析的数据特征、数据清洗、数据集成、数据规范化、数据归约、数据降维、数据分析建模、数据可视化和评估等流程,涵盖了Python常用的数据分析模块和数据分析算法。本书以13章的篇幅介绍Python数据分析,包括Python语言基础、程序控制结构、函数、正则表达式、文件与文件夹操作、用matplotlib实现数据可视化、numpy库、pandas库、数据质量分析、数据预处理、数据分析方法等内容。 本书可作为高等院校各专业的数据分析课程教材,也可作为数据分析人员、想从事数据工作的初学者的参考书。
more >当今世界对信息技术的依赖程度日渐加深,每天都会产生和存储海量的数据。面对海量数据,谁能更好地处理、分析数据,谁就能真正抢得大数据时代的先机。对数据的分析已经成为企业、政府非常重要且迫切的需求。 数据分析是指用适当的数学方法对收集来的大量数据进行分析,以求最大化地开发数据的功能,发挥数据的作用。数据分析是为了提取有用信息和形成结论而对数据加以详细研究及概括总结的过程。数据分析的目的在于把隐藏在一大批看来杂乱无章的数据中的信息集中、萃取和提炼出来。 Python具有开源、简洁、易读、快速上手、多场景应用以及完善的生态和服务体系等优点,使其在数据分析与挖掘领域中的地位显得尤为突出,Python已经当仁不让地成为数据分析人员的一把“利器”。此外,Python也广泛用于系统运维、图形处理、数学处理、数据库编程、网络编程、多媒体应用、机器学习和人工智能等方面。 第1章Python语言基础。首先介绍Python语言的特点,Python的安装方法,编写Python代码的方式,重点介绍Python的基本数据类型的操作命令,并给出相应的实例;其次介绍人机交互的输入和输出,给出Python的多样化格式输出;然后简单介绍Python如何读写文件;最后介绍Python库的导入以及Python扩展库的安装。 第2章程序控制结构。讲解布尔表达式、关系运算符、逻辑运算符,选择结构中的单向if语句、双向ifelse语句、嵌套ifelifelse语句,条件表达式。讲解while循环及循环控制策略,for循环、for循环与range函数的结合使用,break、continue和else控制循环的方式。 第3章函数。讲解怎样定义函数,函数的调用方式,参数传递,函数的参数类型,函数模块化,lambda表达式,变量的作用域,函数的递归调用,常用内置函数。 第4章正则表达式。讲解正则表达式的构成,正则表达式的边界匹配,正则表达式的分组、选择和引用匹配,正则表达式的贪婪匹配与懒惰匹配,正则表达式模块re,正则表达式对象和Match对象。 第5章文件与文件夹操作。讲解文本文件的打开、读写以及文件指针的定位,二进制文件的打开与读写,os、os.path、shutil对文件与文件夹的操作,csv文件的读取和写入。 第6章用matplotlib实现数据可视化。讲解matplotlib架构的后端层、表现层、脚本层,使用matplotlib的pyplot子库绘制线形图、直方图、条形图、饼图以及散点图。 第7章numpy库。讲解ndarray数组的创建,特殊的ndarray数组的创建,ndarray数组的索引、切片和选择,ndarray数组的统计计算。讲解随机数数组、数组的基本运算和数组数据文件的读写。 第8章pandas库。讲解Series对象的创建,Series对象的基本运算,DataFrame对象的创建、DataFrame对象的元素的查看和修改,DataFrame对象的基本运算,pandas数据可视化,pandas读写数据。 第9章数据质量分析。讲解缺失值分析、异常值分析、一致性分析和数据特征分析。 第10章数据预处理。讲解数据清洗、数据集成、数据规范化、数据离散化、数据归约和数据降维。 〖3〗Python数据分析前言〖3〗第11章数据分析方法。讲解相似性和相异性的度量、分类分析方法、回归分析方法和聚类分析方法。 第12章基于信用卡消费行为的银行信用风险分析。讲解信用卡消费数据获取与数据探索分析,信用卡消费数据预处理,信用卡消费数据特征分析和客户信用分析。 第13章文本情感分析。讲解中文分词方法,文本的关键词提取,文本情感分析和运用LDA模型对电商手机评论进行主题分析。 本书由曹洁、崔霄、张志锋、孙玉胜和王博编写,参与本书编写的还有张王卫、桑永宣和陈明。 在本书的编写和出版过程中得到了郑州轻工业大学、清华大学出版社的大力支持和帮助,在此表示感谢。 在本书的编写过程中,参考了大量专业书籍和网络资料,在此向这些作者表示感谢。 由于编写时间仓促,编者水平有限,书中可能会有缺点和不足,热切期望得到专家和读者的批评指正,在此表示感谢。您如果遇到任何问题,或有更多的宝贵意见,欢迎发送邮件至作者的邮箱42675492@qq.com,期待能够收到您的真挚反馈。 配套课件 编者2020年4月于郑州轻工业大学数据融合与知识工程实验室
more >