前言
前言
机器学习(Machine Learning,ML)是多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等。机器学习专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构,使之不断改善自身的性能。
由于Python语言的简洁性、易读性及可扩展性,国内外使用Python做科学计算的研究机构日益增多,一些知名大学也采用Python来教授程序设计课程,Python已经成为最受欢迎的程序设计语言之一。
Python在设计上坚持清晰划一的风格,这使得Python成为一门易读、易维护,并且被大量用户欢迎的、用途广泛的语言。
本书将机器学习背后的基本理论与应用实践联系起来,通过这种方式让读者聚焦于如何正确地提出问题、解决问题。书中讲解了如何使用Python的核心元素以及强大的机器学习库,同时还展示了如何正确使用一系列统计模型。不管你是机器学习的初学者,还是想进一步拓展对机器学习领域的认知,本书都是一个重要且不可错失的资源,能帮助你了解如何使用Python解决机器学习中的关键问题。
之所以学习Python,用Python解决机器学习问题,是因为Python对于大数据的提取、分析完全是没有压力的,这也与其自身的特点有关。
本书共10章,从各方面介绍了机器学习,主要包括以下内容。
第1章机器学习的基础知识,主要介绍了机器学习的概念、综合分类、推荐系统和深度学习、Python软件相关介绍等内容。
第2章Python近邻法,主要介绍了k近邻法三要素、k近邻法、kd树等内容。
第3章Python数据降维,主要介绍了维度灾难与降维、主成分分析、SVD降维、多维缩放降维等内容。
第4章Python分类算法,主要介绍了逻辑回归、Softmax回归、因子分解机、支持向量机、随机森林等内容。
第5章Python回归算法,主要介绍了线性回归、岭回归与Lasso回归等内容。
第6章Python聚类算法,主要介绍了kMeans算法、Mean Shift聚类算法、DBSCAN聚类等内容。
第7章Python神经网络,主要介绍了感知机、BP神经网络、径向基神经网络等内容。
第8章Python推荐算法,主要介绍了协同过滤算法、基于矩阵分解的推荐算法、基于图的推荐算法等内容。
第9章Python频繁项集,主要介绍了关联分析、Apriori算法、FPGrowth算法等内容。
第10章Python数据预处理,主要介绍了数据预处理的基本概述、数据清理、处理缺失值、机器模型等内容。
这些算法目前应用非常广泛,效果也不错,是机器学习的入门知识,读者需要深入理解算法的原理、优劣势等特点以及应用场景,掌握利用Python解决这些问题的方法,并达到应用自如的程度。
本书特点
每个章节都将理论与Python实例相结合进行编写,让读者快速掌握利用Python实现机器学习算法。
每章最后通过小结与习题进行章节内容的总结与掌握情况的检测,习题类型有填空题、问答题、编程题,这样可使读者做到学以致用,上手快。
本书提供教学课件、程序代码、习题答案等配套资源,可以在清华大学出版社官方网站本书页面下载,或者扫描封底的“书圈”二维码在公众号下载。
本书由佛山大学蔡静编写。
由于时间仓促,加之编者水平有限,书中疏漏之处在所难免。在此,诚恳地希望得到各领域专家和广大读者的批评指正。
编者
2024年12月