首页 > 图书中心 >图书详情
Python机器学习实战案例(第2版)
作者:赵卫东 董亮
定价:59元
印次:2-3
ISBN:9787302601241
出版日期:2022.03.01
印刷日期:2023.10.08
机器学习是人工智能的重要技术基础,涉及的内容十分广泛。本书基于Python语言,实现了12个典型的实战案例,其内容涵盖了机器学习的基础算法,主要包括统计学习基础、可视化、常用的分类算法、文本分析、卷积神经网络、循环神经网络、注意力机制、生成对抗网络、电子推荐系统等理论。 本书深入浅出,以实际应用的项目作为案例,实践性强,注重提升读者的动手操作能力,适合作为高等院校本科生及研究生机器学习、深度学习、数据挖掘等课程的实验教材,也可作为对机器学习和深度学习感兴趣的研究人员和工程技术人员的参考资料。
more >第2版前言 近年来人工智能发展很快,已经在很多行业得到成功的应用,推动了企业对人工智能应用人才的需求增长,市场上急缺有较强应用能力、能解决实际问题的高级人才。越来越多的高校开设了人工智能专业,其中机器学习和深度学习等核心课程不仅包含的算法众多,兼具学习难度,而且应用也有一定的门槛。如何在实际应用中掌握这些理论知识是一件非常有挑战性的事情。 目前,高校机器学习和深度学习教学还多停留在理论传授的层次,辅助一些简单的实验,远未达到实用型人才培养的要求。主要的原因之一是缺少有实际项目经验的师资; 另外,机器学习和深度学习的应用充满了不确定性,需要在实战项目中才能积累必要的技能和技巧。 如何通过精读一些典型案例的讲解,揣摩机器学习和深度学习项目流程每个步骤的常见问题以及处理方法,已经成为入门实战项目的重要基础。为此,我们在第1版的基础上,从与企业合作的真实项目或预研项目中,经过一定的简化和抽象,精选了12个案例。这些案例都有一定的综合性,尽量接近实际项目的复杂性,多数案例都使用了多种机器学习或深度学习的典型算法,对于检验读者基础算法的理解广度和深度,都有一定的挑战。 第2版拓展了一些内容,基于典型的应用场景,利用TensorFlow、PaddlePaddle等主流开源框架,思路尽量覆盖常用的数据可视化、分类算法、文本分析、卷积神经网络、循环神经网络、注意力机制、生成对抗网络、电子推荐系统等机器学习和深度学习核心知识的灵活应用。 第2版主要对第1版做了如下修改: (1) 为了便于读者检验对基本的机器学习和深度学习算法的掌握情况,在本书的附录A和附录B提供了190多道选择题、判断题和简答题,分别对应机器学习和深度学习的基本知识点,读者可以在阅读案例前练习,并结合作者已经出版的《机器学习》(人民邮电出版社,2018)以及中国大学MOOC的深度学习及其应用课程(https://www.icourse163.org/course/FUDAN1205806833)进行学习。 (2) 补充了基于YOLO v5的电动车头盔检测、基于改进UNet算法的农业图像分割、基于注意力和TextCNN的新闻文本分类三个详细的案例,使内容有更广的覆盖度。此外,更新了第1版第8章基于深度学习的图片识别系统,适应了PaddlePaddle框架的更新。还删除了比较简单的第1版第10章的案例。 感谢百度和阿里云计算有限公司的支持。在写作本书的过程中,研究生林沿铮、王卓超等同学在资料收集和校对等方面做了不少工作,在此一并表示感谢。 赵卫东 2021年9月 第1版前言 当前,随着信息时代的快速发展,银行、投资、零售、互联网甚至传统的制造业都产生了大量数据。各行各业开始逐步应用机器学习算法分析数据,以便在海量数据中总结出规律,辅助决策。这种发展趋势使得就业市场对数据科学、机器学习人才的需求不断增加,同时对人才的多元化、综合实践能力提出了要求。 随着数据分析相关行业的快速发展,数据分析在各个领域都得到了很多成功的应用,企业和政府部门都期望在各个业务方面的工作由数据分析能力强的人承担,更期望员工能够探索有效的数据分析方法,并根据实际数据场景分析结果做出决策,将分析和处理数据作为日常工作流程的一个环节,而不是将数据分析作为一项专业技能。同时,随着数据种类的增多和数量的爆炸式增长,市场对毕业生的数据分析和处理能力提出了更高的要求。高校的基本职能是培养人才,为了使学生更好地适应现代工作场所和终身发展,需要认真思考如何培养应用型人才,以适应当前的就业环境。机器学习相关专业以培养数据分析师、算法工程师、大数据工程师等数据分析、应用型人才为目标,这不仅要求学生理解算法本身,更需要学生具备跨学科的实践能力,将算法逻辑应用到实际生产、生活场景以解决现实问题。 企业对数据分析人才的数量和质量的高要求导致了大数据技术、人工智能人才的大缺口,而目前高校的机器学习教学偏向理论化,更多地注重算法本身,缺乏完善的实践教学体系和教学资源。学生的课堂学习只是面对多种专业理论知识,缺少真实项目的实践过程,学生不能有效地将学习内容应用到实践过程中,这与应用型人才的培养目标存在一定的差距,毕业生不足以适应竞争激烈的就业市场。因此,高校需要更多地考虑就业环境对学生的真实需求,对传统的教学模式进行变革,掌握数据科学时代的新技术和新应用,在遵循教育规律的基础上,将实际项目实践与理论教学融为一体,逐步调整课程内容,培养学生自主思考与解决实际问题的能力,从而提高他们的竞争优势。 如何在教学过程中结合项目实践,已经成为各高校关注的话题。传统的机器学习教学在技能培养、数据与实际案例的选择上仍存在很大的提高空间,这与新时代机器学习人才发展的需求存在一定距离,有必要对人才培养与项目实践相结合进行探索,尝试新的满足社会发展需要的教学模式,为培养具有专业素质和创新能力的机器学习人才奠定坚实的基础。 在学生理解算法原理的基础上,可采用灵活的教学方法来培养学生对实际应用场景的认知。结合案例展示其应用,然后提出一些新问题。学生通过模仿实现一个类似的验证型实验项目,该项目作为实验项目的原型,学生可访问、分析其功能、代码并测试其效果。随后,以此为基础做扩展实践,学生可以模仿教师提供的案例,通过自主设计并实现一个相对完整的项目,深化并巩固所学的知识,锻炼整体考虑问题的能力,提高灵活应用知识的能力和创新能力。 由于企业面对的很多问题并不能直接交由机器处理,数据的筛选、特征提取以及算法的整合与取舍是需要技巧的。同时,企业实践项目真实灵活并且与当前研究热点紧密相关,在项目解决方案的探讨中学生会面临很多问题,例如样本的不平衡、算法存在的某些缺陷等,这些问题不能直接地从课堂或其他途径上获取到有效的解决方案,更多地需要学生自身总结经验,在现有的思路上进行调优,从而帮助学生掌握算法缺陷,自主发现一些原有教学中被忽略的难点。 企业实践项目不同于常规教学实验,在大多数传统教学方法中,学生按照已有步骤进行规范化的实验,往往可以获得满意的结果。本书正是基于以上的现实需求,结合作者最近几年与企业合作的实战项目,通过一定的抽象和简化,精选了十个比较实用的实训案例,可以作为高校机器学习课程的实验教材,也可以作为学习Python课程的实训教材。 学习本书之前,读者需要掌握基本的机器学习理论,附录有测试题,可以在学习前检验。 在本书的写作过程中,研究生蒲实、于召鑫和本科生高名扬在资料收集方面做了很多工作,特此表示感谢。 赵卫东 2019年6月
more >