首页 > 图书中心 >图书详情
Python机器学习基础
作者:唐四薪
丛书名:计算机系列教材
定价:56元
印次:1-3
ISBN:9787302611288
出版日期:2022.09.01
印刷日期:2024.07.24
本书对机器学习算法的基本原理和Python程序实现进行了系统的介绍,每种算法都采用Sklearn程序实现和Matplotlib数据可视化。本书共8章,内容包括Python语言基础、机器学习概述、关联规则与推荐算法、聚类、分类、回归与逻辑回归、人工神经网络和支持向量机。 本书可作为高等院校相关专业机器学习或人工智能概论等课程的教材,也可作为从事人工智能、机器学习研究和应用的人员的参考书。
more >前言 随着人工智能产业的兴起,机器学习方法在各行各业中的应用迅速普及。当前,新一轮科技革命和产业变革正在萌发,大数据的形成、理论算法的革新、计算能力的提升及网络设施的演进驱动人工智能发展进入新阶段,智能化成为技术和产业发展的重要方向。人工智能具有显著的溢出效应,将进一步带动其他技术进步,推动战略性新兴产业总体突破。因此,研究和学习机器学习技术正当其时、恰逢其势,是大有作为的。 目前市面上有很多机器学习及其编程的图书。这些图书根据侧重点不同大致可分为两类: 一类以讲解机器学习的算法理论为主,而对机器学习的编程实现讲述得少。由于机器学习的模型复杂,如果不讲述编程实现,读者往往觉得要将理论用于解决实际问题还是有一段距离,无从下手;另一类以讲解机器学习的编程为主,读者如果没有学过机器学习的理论,将很难理解程序的编程思想及各种参数的含义,导致无法独立编写程序,无法解决实际问题。 为了解决以上问题,并使机器学习更加通俗易懂,本书将机器学习的算法原理与编程实现融合在一起阐述。 需要提醒读者的是,机器学习是一门难度很大的学科,其难点大致有以下4方面。 (1) 机器学习中大部分算法复杂难懂,因为这些算法对于初学者来说往往是方法新颖,概念抽象。有些大型机器学习模型(如人工神经网络)的学习过程是烦琐机械的,无法将整个过程的细节都一步步写出来。故学术界认为,随着模型越来越复杂,机器学习模型的可解释性(interpretability)越来越差。例如,现在很多的深度神经网络没有办法从人类的角度来完全理解模型,这些模型需要读者从黑盒的层面理解。 (2) 在各种机器学习模型中,有一些通用的最优化算法和参数估计算法,其中最典型的算法包括最小二乘法、梯度下降法、极大似然估计法、EM算法、反向传播算法、拉格朗日乘数法。这些算法涉及许多数学知识。读者一定要先掌握这些通用算法,才能较好地理解各种机器学习模型。由于这些算法很重要,因此本书在附录中对这些算法之间的关联性进行了总结。 (3) 用机器学习方法解决某个实际应用的过程是烦琐枯燥的,如收集大量数据、特征提取、数据标准化、数据降维这些数据预处理的工作都是很耗时的过程,初学者如果对机器学习的过程理解得不透彻,或者惧怕过程的烦琐,就无法坚持完成。 (4) 选择模型、训练模型、评估模型由于要考虑实际问题中的各种因素以及调整参数、避免欠拟合和过拟合,导致过程也是相当复杂的。如果初学者对其中的理论和方法掌握不全面,就很容易导致得到的机器学习模型性能太差、无法使用的问题。 在编写本书时,笔者尽力回忆自己的学习过程,着重解决在学习机器学习过程中容易“掉坑”的地方。本书的特色是: 首先以面向初学者的视角详细叙述某种算法的原理,且以例题讲解为主。然后介绍使用Sklearn编写机器学习程序。Sklearn库是一种高度封装好的机器学习算法库,具有简单易学的特点,通过学习Sklearn能够很好地加深对机器学习概念和模型的理解。掌握Sklearn库是进一步学习TensorFlow深度学习算法库的基础。最后在每章最后一节安排一个综合案例,通过该案例读者可了解算法具体实现时是如何处理各种细节问题的。为了提高读者的学习兴趣,本书对所有Sklearn程序均使用Matplotlib库实现数据分析的可视化,这是具有实用价值的。 学习机器学习的目的是使用这种技术来解决实际问题,因此一定要能将机器学习的算法运用到实际案例中。虽然目前人们开发出了一些机器学习算法库,这使得人们可以不知道算法的具体细节,也能编写机器学习程序。但如果要用这些算法解决实际问题,不知道算法细节是很难编写出有实用价值的程序的。 作为教材,本书注重教材立体化建设。本书每章后都提供了具有丰富题型的大量习题,并在习题部分安排了能作为实验内容的实验题。本书提供配套资料(微课视频、PPT课件、习题答案、教学大纲和实验指导),可在本书配套网站上下载,网址为: https://mooc1.chaoxing.com/course/222572414.html,也可在清华大学出版社网站下载。 本书由唐四薪编著,参加编写工作的还有唐琼、李浪、唐金娟、谢海波、唐佐芝、舒清健等。 本书是湖南省普通高等学校教学改革研究项目(HNJG20200687)“应用型本科院校程序设计类课程体系的重构与教学改革研究”的研究成果。 本书在编写过程中参考了大量专家学者和机器学习爱好者的图书资料,作者已尽可能地在参考文献中列出,谨在此表示感谢,若有疏漏,也在此表示歉意。由于作者水平和教学经验有限,书中错误和把握不当之处在所难免,敬请广大读者和同行批评指正。 编者2022年3月
more >