





作者:邓立国
定价:69元
印次:1-1
ISBN:9787302548997
出版日期:2020.05.01
印刷日期:2020.04.08
图书责编:夏毓彦
图书分类:零售
本书理论与实践相结合,详细阐述机器学习数据特征与分类算法,基于Python 3精心编排大量的机器学习场景与开源平台应用,高效利用Python 3代码翔实地阐释机器学习核心算法及其工具的场景应用。 本书分为6章,主要内容包括机器学习概述、数据特征、分类算法、项目,以及在机器学习平台Kaggle与PaddlePaddle上实现分类、预测及推荐等实战操作。 本书适合机器学习的研究人员、计算机或数学等相关从业者参考学习,也可以作为计算机或数学等专业本科高年级或研究生专业用书。
邓立国,东北大学计算机应用博士毕业。2005年开始在沈阳师范大学软件学院、教育技术学院任教,主要研究方向:数据挖掘、知识工程、大数据处理、云计算、分布式计算等。以第一作者发表学术论文30多篇(26篇EI),主编教材 1 部,主持科研课题6项,经费10余万元,多次获得校级科研优秀奖,作为九三社员提出的智慧城市提案被市政府采纳,研究成果被教育厅等单位采用。
前 言 机器学习是人工智能领域核心的研究方向,其应用遍及人工智能的各个领域。机器学习已经有了十分广泛的应用,例如数据挖掘、计算机视觉、自然语言处理、生物特征识别、搜索引擎、医学诊断、检测信用卡欺诈、证券市场分析、DNA序列测序、语音和手写识别、战略游戏和机器人运用等。机器学习是人工智能和神经计算的核心研究课题之一,解决计算机程序如何随着经验积累自动提高性能。 作者在工作中接触和应用机器学习的相关算法过程中,发现目前没有比较完备的基于Python 3语言的机器学习专业图书,所以写了这本以Python 3为基础实践语言的机器学习工具书,仅供从事机器学习人员参阅。 本书内容 本书的目的是展现基于Python 3机器学习中核心的算法与实践,重点介绍与机器学习相关的知识理论与Python实例。 本书分为6章,系统地讲解机器学习的典型算法:第1章简要介绍有关机器学习的基础知识,第2章讲解机器学习的数据特征,第3章介绍机器学习的分类算法,第4章主要介绍机器学习开源项目场景应用,第5、6章在机器学习平台Kaggle与PaddlePaddle上进行算法应用。本书的例子都是在Python 3集成开发环境Anaconda 3中经过实际调试通过的典型案例,大部分实验数据来源于GitHub,并且很多例子源程序都给出了网址地址,读者可以参考实现。 本书读者 本书可以作为计算机科学与工程、计算统计学和社会科学等专业的大学生或研究生的专业参考书,也可作为软件研究人员或从业人员的参考资料。由于机器学习专业素材的多学科性,读者可以根据对应的知识背景参考对应的专业书籍。 源码下载 ...
第1章 机器学习概述 1
1.1 机器学习定义 1
1.2 机器学习的发展 2
1.3 机器学习的分类 3
1.4 机器学习的研究领域 6
1.5 本章小结 8
第2章 机器学习数据特征 9
2.1 数据分布性 9
2.1.1 数据分布集中趋势的测定 9
2.1.2 数据分布离散程度的测定 14
2.1.3 数据分布偏态与峰度的测定 17
2.2 数据相关性 19
2.2.1 相关关系 19
2.2.2 相关分析 22
2.3 数据聚类性 24
2.4 数据主成分分析 27
2.4.1 主成分分析的原理及模型 27
2.4.2 主成分分析的几何解释 29
2.4.3 主成分的导出 30
2.4.4 证明主成分的方差是依次递减 31
2.4.5 主成分分析的计算 32
2.5 数据动态性 34
2.6 数据可视化 37
2.7 本章小结 39
第3章 机器学习分类算法 40
3.1 数据清洗和特征选择 40
3.1.1 数据清洗 40
3.1.2 特征选择 42
3.1.3 回归分析 45
3.2 决策树、随机森林 47
3.3 SVM 51
3.3.1 最优分类面和广义最优分类面 52
3.3.2 SVM的非线性映射 55
3.3.3 核函数 56
3.4 聚类算法 56
3.5 EM算法 61
3.6 贝叶斯算法 63
3.7 隐马尔可夫模型 63
3.8 LDA主题模型 66
3.9 人工神经网络 69... 查看详情