





定价:69元
印次:1-3
ISBN:9787302616177
出版日期:2022.09.01
印刷日期:2024.03.13
图书责编:夏毓彦
图书分类:零售
使用机器学习进行数据可视化分析是近年来研究的热点内容之一。本书使用**的Python作为机器学习的基本语言和工具,从搭建环境开始,逐步深入到理论、代码、应用实践中去,从而使初学者能够独立使用机器学习完成数据分析。本书配套示例代码、PPT课件和答疑服务。 本书分为10章,内容包括:机器学习与Python开发环境、用于数据处理及可视化展示的Python类库、NBA赛季数据可视化分析、聚类算法与可视化实战、线性回归与可视化实战、逻辑回归与可视化实战、决策树算法与可视化实战、基于深度学习的酒店评论情感分类实战、基于深度学习的手写体图像识别实战、TensorFlow Datasets和TensorBoard训练可视化。 本书内容详尽、示例丰富,是机器学习初学者的入门书和必备的参考书,也可作为高等院校计算机及大数据相关专业的教材使用。
王晓华,计算机专业讲师,长期讲授面向对象程序设计、数据结构、Hadoop程序设计等研究生和本科生相关课程;主要研究方向为云计算、数据挖掘。曾主持和参与多项国家和省级科研课题,独立科研项目获省级成果认定,发表过多篇论文,拥有一项国家专利。著有《Spark MLlib机器学习实践》《TensorFlow深度学习应用实践》《OpenCV+TensorFlow深度学习与计算机视觉实战》《TensorFlow 2.0卷积神经网络实战》《TensorFlow+Keras自然语言处理实战》等图书。
前 言 机器学习无疑是当前数据挖掘领域的一个热点内容,其理论和方法已经广泛应用于解决工程应用的复杂问题之中,很多人在日常工作中都或多或少地用到了机器学习的算法。 但是长期以来,由于从业者的知识能力储备不同和具体复杂的业务环境,机器学习技术并没有被广泛地应用。究其原因是机器学习主要是针对数字以及以数字为基础的矩阵进行模拟计算,而无论是在训练过程还是在结果的导出上,大多数都是单纯地使用数字进行结果呈现,无法直接对事件的走势或具体内容做一个直观可视化的展示,因此这极大地限制了机器学习在具体项目中落地和实现。 本书通过机器学习与可视化组件相结合的方式,系统地介绍机器学习与可视化分析相关技术,并通过实战项目讲解机器学习中最常用的数据挖掘相关知识,例如聚类、线性回归、逻辑回归以及决策树算法。特别是为了满足部分学者的需求,本书详细介绍了深度学习的两个基础算法——图像识别与文本分类算法。 可视化组件的加入,可以很容易地让使用者或者审阅者更直接地对机器学习过程和结果进行可视化分析,而Python本身也提供了多种多样的可视化分析模块,可以从不同角度对数据结果进行直接分析,从而降低了学习和理解的难度。 本书以Python为基础编程语言进行编写,循序渐进地教会读者使用机器学习算法切实地解决现实中遇到的各种问题,并通过多种图表、趋势线与分布图的形式进行展示。本书从基本的常用数据分析开始,到最终使用各种高性能机器学习库,包括利用Sklearn、TensorFlow进行深度学习程序设计和实战分析,全面介绍使用机器学习技术进行数据项目分析的核心内容和相关知识,内容全面而翔实。 同时,本书对机...
第1章 机器学习与Python开发环境 1
1.1 机器学习概述 1
1.1.1 机器学习的前世今生 1
1.1.2 机器学习的研究现状与方向 3
1.1.3 机器学习之美——数据的可视化 4
1.2 Python的基本安装和用法 5
1.2.1 Anaconda的下载与安装 6
1.2.2 Python编译器PyCharm的安装 8
1.2.3 使用Python实现softmax函数计算 11
1.3 Python常用类库中的threading 12
1.3.1 threading模块中的Thread类 13
1.3.2 threading中Lock类 14
1.3.3 threading中Join类 15
1.4 本章小结 16
第2章 用于数据处理及可视化展示的 Python类库 17
2.1 从小例子起步——NumPy的初步使用 17
2.1.1 数据的矩阵化 17
2.1.2 数据分析 19
2.1.3 基于统计分析的数据处理 20
2.2 图形化数据处理——Matplotlib包的使用 21
2.2.1 差异的可视化 21
2.2.2 坐标图的展示 22
2.2.3 大数据的可视化展示 23
2.3 常用的统计分析方法——相似度计算 26
2.3.1 欧几里得相似度计算 26
2.3.2 余弦相似度计算 27
2.3.3 欧几里得相似度与余弦相似度的比较 28
2.4 数据的统计学可视化展示 28
2.4.1 数据的四分位数 28 ... 查看详情