首页 > 图书中心 > Python机器学习算法及应用

前言

前言

人工智能(Artificial Intelligence,AI)的研究从20世纪40年代已经开始,在近80年的发展中经历了数次大起大落。自从2016年AlphaGo战胜顶尖的人类围棋选手之后,人工智能再一次进入人们的视野,成为当今的热门话题。人工智能的最新发展可以说是“古树发新枝”,到底是什么原因使沉寂多年的人工智能技术焕发了青春的活力呢?

首先,移动互联网的飞速发展产生了海量的数据,使人们有机会更加深入地认识社会、探索世界、掌握规律。其次,大数据技术为人们提供了有力的技术手段,使人们可以面对瞬息万变的市场,有效地存储和处理海量数据。最后,计算技术特别是GPU(图形处理器)的广泛应用使算力有了大幅度的提升,以前需要几天的运算如今只需要几分钟或几秒,这为机器学习的普及与应用提供了计算基础。

机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。机器学习算法是一类从数据中自动分析获得规律,并利用规律对未知数据进行预测的算法。因为学习算法中涉及了大量的统计学理论,机器学习与统计推断学联系尤为密切,所以也被称为统计学习理论。

机器学习是数据科学中数据建模和分析的重要方法,既是当前大数据分析的基础和主流工具,又是通往深度学习和人工智能的必经之路; Python是数据科学实践中最常用的计算机编程语言,是当前最流行的机器学习实现工具,因其在理论和应用方面的不断发展完善而拥有长期的竞争优势。在学好机器学习理论的同时,掌握Python语言这个实用工具,是成为数据科学人才所必不可少的。

当全世界都在赞叹人工智能机器时代即将到来的同时,对人工智能机器专业的人才需求急剧增加,大量的高薪职位却招不到人。处在这样一个拥有大好机会的人工智能、机器学习时代,为何不给自己一个进入人工智能行业的机会呢?本书将机器学习的基本理论与应用实践联系起来,通过这种方式让读者聚焦于如何正确地提出问题、解决问题。书中讲解了如何利用Python的核心代码以及强大的函数库,实现机器学习的分析与实战。不管你是初步接触机器学习,还是想进一步拓展对机器学习领域的认知,本书都是一个重要且不可错过的资源,它有助于了解如何使用Python实现解决机器学习中遇到的各种实战问题,让读者能够快速成为机器学习领域的高手。

本书编写特色主要表现在以下方面。

1. 内容浅显易懂

本书不会细究晦涩难懂的概念,而是力求用浅显易懂的语言引出概念,用常用的方式介绍编程,用清晰的逻辑解释思路。

2. 知识全面

机器学习是一个交叉性很强的学科,涉及统计学、数据科学、计算机学科等多个领域的知识。书中从介绍机器学习相关理论出发,接着介绍机器学习分类算法,然后介绍sklearn机器学习分类器,再由实例总结巩固机器学习在各领域中的应用,全面、系统、由浅到深地介绍整本书内容。

3. 实用性强

本书在理论上突出可读性并兼具知识的深度和广度,在实践上强调可操作性并兼具应用的广泛性。书中各章都做到理论与实例相结合,内容丰富实用,帮助读者快速领会知识要点。书中的源代码、数据集等读者都可免费获得。

4. 独特有效的讲解方式

本书采用一种独特而有效的方式讲解机器学习: 一方面,依知识点的难度,由浅入深地讨论众多主流机器学习算法的原理; 另一方面,通过Python编程和可视化图形,直观地展示抽象理论背后的朴素道理和精髓,通过应用案例强化算法的应用实践。

全书共12章,各章的主要内容如下。

第1章介绍了在数据上的计算机学习能力,主要包括转换机器学习、评估机器学习模型、机器学习工作流程、应用Python解决机器学习问题等内容。

第2章介绍了简单的机器学习分类算法,主要包括机器学习的早期历史——人工神经网络、自适应神经学习、大规模机器学习与随机梯度下降等内容。

第3章介绍了sklearn机器学习分类器,主要包括分类器的选择、基于逻辑回归的分类概率建模、支持向量机最大化分类间隔、核SVM解决非线性分类问题、决策树等内容。

第4章介绍了数据预处理,主要包括数据清洗、划分训练集与测试集、数据特征缩放、特征选择等内容。

第5章介绍了降维实现数据压缩,主要包括数据降维、主成分降维、线性判别分析监督数据压缩、非线性映射核主成分降维等内容。

第6章介绍了不同模型的集成学习,主要包括集成学习、多投票机制组合分类器、Bagging模型、Stacking模型等内容。

第7章介绍了连续变量的回归分析,主要包括线性回归、最小二乘线性回归、使用RANSAC算法拟合健壮性回归模型、线性回归模型性能的评估等内容。

第8章介绍了数据的聚类分析,主要包括KMeans算法、层次聚类、DBSCAN算法等内容。

第9章介绍了从单层到多层的人工神经网络,主要包括人工神经网络建模复杂函数、识别手写数字等内容。

第10章介绍了使用深度卷积神经网络实现图像分类,主要包括构建卷积神经网络、使用LeNet5实现图像分类、使用AlexNet实现图片分类等内容。

第11章介绍了使用循环神经网络实现序列建模,主要包括RNN、双向循环神经网络、Seq2Seq模型序列分析等内容。

第12章介绍了使用生成对抗网络合成新数据,主要包括GAN原理、GAN应用、强化学习等内容。

互联网、物联网对全球的覆盖以及计算机技术的不断提升,推动了机器学习算法的快速发展,并且使其在各个行业领域中得到广泛应用。通过本书的学习,可以学会利用Python解决机器学习中的各种实际问题,达到应用自如的程度。

本书由佛山科学技术学院梁佩莹博士编写。

本书可作为高等学校相关专业本科生和研究生的学习用书,也可作为相关专业科研人员、学者、工程技术人员的参考用书。

由于时间仓促,加之编者水平有限,疏漏之处在所难免。在此,诚恳地期望得到各领域专家和广大读者的批评指正。

编者2024年2月

版权所有(C)2023 清华大学出版社有限公司 京ICP备10035462号 京公网安备11010802042911号

联系我们 | 网站地图 | 法律声明 | 友情链接 | 盗版举报 | 人才招聘