首页 > 图书中心 >图书详情

商务数据挖掘与可视化——基于Python的应用

教辅资源:课件、数据文件,本书特色:新形态教材、课程思政教材,商务数据挖掘核心技术理论原理讲解,可视化工具深入学习与实践开发,Python语言快速高效实现每个案例知识。

作者:谢贤芬、古万荣
定价:69
印次:1-1
ISBN:9787302636601
出版日期:2023.12.01
印刷日期:2023.12.08

本书以商务数据处理与应用为基本出发点,重点介绍基于 Python 语言的商务数据处理技巧、数据分析方法及可视化操作,内容包括:常见的数据管理及分析软件介绍,Python编程基础,Matplotlib、Seaborn和Pyecharts数据可视化,线性相关与回归分析,数据压缩、聚类、时间序列、大数据分析方法,综合案例实战。 本书案例内容丰富,通过26个综合案例详细介绍了数据挖掘方法及可视化在商务数据中的应用,展现了Python的强大数据分析能力。读者在了解数据挖掘方法原理的基础上,通过案例学习可以更有效地提高其数据分析的实际能力。本书适用于各个层次的读者,既可面向非计算机专业的数据分析者,强调应用性和实战性,也可作为计算机专业或数据科学专业的基础应用学习书。

more >

随着现代信息技术的飞速发展,数据分析、数据挖掘、机器学习、云计算等数据科学技术也相应流行起来。数据挖掘技术与可视化在海量数据处理方面有着极大的现实意义。相较于其他数据可视化软件平台,Python具有开源免费、易上手的优点,从而越来越被大家熟悉和认可,成为数据挖掘、数据分析、机器学习等领域研究者最常用的编程语言。 数据挖掘是利用机器学习、统计学和概率论等方法,从海量数据中获取有效的、潜在有用的信息的过程。数据可视化是研究数据视觉表现形式的技术。在海量商务数据中,可以利用数据挖掘与可视化技术来获取可靠、真实的市场信息,为各类商业活动提供更多决策支持。 本书由浅入深地介绍了基于Python的商务数据挖掘与可视化技术,并对每个技术详细地进行了案例分析与说明。读者可以通过阅读本书,掌握基本的商务数据挖掘与可视化方法。 本书内容 本书提供了Python与数据挖掘的基础理论内容,同时介绍了多个实用的数据挖掘与可视化库。本书提供了大量案例以供读者实战操练,降低了学习数据挖掘与可视化的门槛,让非专业的读者也能轻松学习。 本书首先介绍了数据挖掘的基本概念和数据挖掘的常用软件,数据挖掘编程平台及Python编程基础。随后介绍了基于Python的数据可视化软件库:Matplotlib、Seaborn和Pyecharts。本书还介绍了数据挖掘的常用方法,包括线性相关与回归、数据压缩、聚类和时间序列等。另外,本书针对大数据场景,介绍了此场景下的数据分析方法。最后,本书整合前面的知识,进行了综合案例实战。 本书结构 本书共11章,各章简介如下。 第1章介绍了数据管理及分析软件。本章着重介绍了基本流程中的几个核心问题:如何收集数据并进行管理、常见的数据挖掘软件有哪些、不同软件平台的特点及适用性等。 第2章介绍了Python编程基础,主要包括Python程序的基本概念和基本语法,以及Python基本分析库的使用,并通过一个网络电影播放量排行榜案例来帮助读者熟悉Python的语法使用。 第3章介绍了Matplotlib数据可视化。作为Python强大的图形库之一,Matplotlib和NumPy搭配使用时可营造一个强大的科学计算环境,可以用来代替Matlab,有助于使用者通过Python来深入了解机器学习或者数据科学。 第4章介绍了Seaborn数据可视化。本章从分组绘图与分面绘图两方面介绍了Seaborn的基本绘图参数,详细地介绍了多个统计绘图函数,涵括了现实场景的基本绘图类型,其中包括:因子变量图、数值变量图、两变量关系图、时间序列图和热力图。最后结合多个综合案例实战,帮助读者熟悉Seaborn绘图的常见用法。 第5章介绍了Pyecharts数据可视化。具体介绍了Pyecharts的全局配置项、数据系列配置项。每个配置项都对应案例说明该配置项在图像上的效果。还介绍了Pyecharts生成HTML(超文本标记语言)文件和生成图片的方式。最后结合综合案例实战,帮助读者进一步熟悉Pyecharts各个配置项的使用。 第6章介绍了线性相关与回归分析,其中包括单变量线性相关与回归和多元线性相关与回归。在综合案例中,使用SciPy和Statsmodels统计分析库进行了线性相关与回归分析。 第7章介绍了数据压缩分析方法。通过数据压缩,能简化属性、去噪、去冗余,但同时又不损失太多数据本身的意义。具体主要对主成分分析(PCA)进行讲述,包括其基本概念、基本步骤、计算和分类等,并结合综合案例使用了数据压缩分析法。 第8章介绍了聚类分析方法。具体介绍了聚类分析的概念和基本思想。此外还介绍了常见聚类分析方法,包括系统聚类法、快速聚类法、有序聚类法和模糊聚类法,并结合综合案例使用了聚类分析方法。 第9章介绍了时间序列分析方法。具体介绍了时间序列的概念。此外还介绍了时间序列的基本模型,其中包括自回归模型(Autoregressive Model,AR模型)、移动平均模型(Moving Average Model,MA模型)、自回归移动平均模型(Autoregressive Moving Average Models,ARMA模型)和差分自回归移动平均模型(Autoregressive Integrated Moving Average Models,ARIMA模型)。该章着重介绍了ARIMA模型的构建方法,并结合综合案例使用了ARIMA模型进行分析。 第10章介绍了大数据分析方法。具体介绍了大数据的概念及常见应用领域。此外还介绍了文本挖掘方法,并结合案例进行了词云分析和文本挖掘分析。该章还介绍了网络爬虫方法和常见的网络爬虫框架,并结合进行了基于Python的网络爬虫实践。 第11章是综合案例实战,对前面章节所讲的数据挖掘和可视化的内容进行总结。并且结合商用软件介绍几个综合案例,包括基于国内旅游情况数据的可视化分析、基于广州市二手房房价的可视化分析以及基于热销私家车销量数据的可视化分析。 本书读者对象 本书将下列人员作为目标读者。 (1)互联网、咨询、零售、金融等行业中,从事数据挖掘与可视化的从业人员。 (2)在产品、市场、用户、品牌等工作中,有数据挖掘与可视化需求的人士。 (3)高等学校计算机、金融、统计等相关专业的学生。 本书由暨南大学谢贤芬、华南农业大学古万荣共同完成。本书获暨南大学研究生教材建设项目资助(立项编号:2021YJC007),在此表示感谢。此外,还要感谢在本书撰写和出版过程中给予过帮助的人,尤其是以下研究生,在资料收集和数据整理方面做了许多工作:陈蔚钊、黄锦涛、李观明、朱奕鑫等。 由于作者知识和水平有限,书中难免有不足之处,敬请读者和同行批评指正! 编 者 2023年1月

more >
扫描二维码
下载APP了解更多

同系列产品more >

统计学:SPSS应用及案例分析

王秀芝
定 价:49元

查看详情
实用多元统计分析

严明义
定 价:59.80元

查看详情
SPSS统计分析高级教程

李国柱、李从欣
定 价:55元

查看详情
统计学原理与实务

李玉红、马云驰、王海东
定 价:75元

查看详情
统计学(第2版)

李荣平、贾荣言、许俊臣
定 价:59元

查看详情
图书分类全部图书
more >
  • 谢贤芬,女,博士,硕士生导师,毕业于暨南大学统计学专业。广州大数据产业协同创新联盟专家委员。具有深厚的计算机和经济学交叉学习和工作背景,本科和硕士就读于暨南大学计算机专业,曾任加拿大北电通信设备有限公司(Notel)高级工程师,主研高性能大数据处理平台;发表SCI/EI论文/国内**期刊/国内核心期刊论文30余篇;出版专著4本,申请国家发明专利2项,授权软件著作版权2项;主持项目14项(国家级项目1项,省部级及以上项目5项),重点参与项目十多项(国家级项目2项,省部级4项等);擅长经济金融、统计、计量经济、数据科学、信息推荐等相关领域的基础与应用研究。在大数据处理与分析、深度学习方法、经济金融风险评价和预警监测、突发事件风险评价领域有较深厚的研究工作积累 ,取得一系列有影响的创新科研成果。

  • 本书案例内容丰富、强调应用性和实战性。本书配备精美教学课件

more >
  • 第1章  数据管理及分析软件 1

    1.1  数据收集及管理 1

    1.2  数据挖掘软件 6

    1.3  习题 8

    第2章  Python编程基础 10

    2.1  Python简介 10

    2.2  数据挖掘编程平台 13

    2.3  Python基本语法 21

    2.4  基本分析包 41

    2.5  习题 54

    第3章  Matplotlib数据可视化 55

    3.1  Matplotlib基本参数配置 55

    3.2  绘图参数文件及主要函数 62

    3.3  Matplotlib基本绘图 70

    3.4  Matplotlib绘图案例 94

    3.5  习题 103

    第4章  Seaborn数据可视化 105

    4.1  Seaborn库简介 105

    4.2  基本绘图参数设置 105

    4.3  统计绘图函数 115

    4.4  Seaborn可视化案例 132

    4.5  习题 141

    第5章  Pyecharts数据可视化 142

    5.1  Pyecharts全局参数配置 142

    5.2  数据系列配置 157

    5.3  运行环境 173

    5.4  习题 180

    第6章  线性相关与回归分析 182

    6.1  单变量线性相关与回归 182

    6.2  多元线性相关与回归 190

    6.3  综合案例:我国财政收入水平的区域差异分析 197

    6.4  习题 204

    第7章  数据压缩分析方法 205

    7.1  主成分分析的概念 205

    7.2  主成分的基本分析 211

    7.3  综合案例 217

    7.4  习题 224...

精彩书评more >

标题

评论

版权所有(C)2023 清华大学出版社有限公司 京ICP备10035462号 京公网安备11010802042911号

联系我们 | 网站地图 | 法律声明 | 友情链接 | 盗版举报 | 人才招聘