目录
第一部分基础篇
第1章机器学习基础
1.1机器学习概述
1.1.1机器学习任务
1.1.2重要概念
1.1.3性能评估
1.2编程语言与环境
1.2.1Python简介
1.2.2Python环境配置与安装
1.2.3Python机器学习编程库
1.2.4PyTorch框架
第2章数据预处理
2.1数据清洗
2.1.1缺失值处理
2.1.2离群值检测
2.2数据转换
2.2.1数字化
2.2.2离散化
2.2.3正规化
2.2.4数值转换
2.3数据压缩
2.3.1降维
2.3.2实例选择和采样
2.4应用案例: 基于PCA的数据降维
2.4.1数据集
2.4.2PCA降维
2.4.3案例结果及分析
第3章简单分类算法
3.1朴素贝叶斯分类算法
3.2KNN分类算法
3.2.1KNN算法实现原理
3.2.2KNN算法实现步骤
3.2.3KNN算法优缺点
3.3应用案例: KNN分类
3.3.1数据集
3.3.2构建KNN分类器
3.3.3案例结果及分析
第4章决策树
4.1决策树模型
4.2特征选择
4.2.1特征和数据划分
4.2.2划分标准
4.3决策树生成算法
4.3.1ID3决策树生成算法
4.3.2C4.5决策树生成算法
4.4CART算法
4.4.1决策树的剪枝
4.4.2CART生成算法
4.4.3CART剪枝算法
4.5应用案例: 基于决策树的鸢尾花图像分类
4.5.1数据集
4.5.2构建决策树
4.5.3案例结果及分析
第5章支持向量机
5.1支持向量机的基本原理
5.1.1线性可分
5.1.2最大间隔问题
5.1.3支持向量
5.2常用核函数
5.2.1线性核函数
5.2.2高斯核函数
5.2.3多项式核函数
5.3应用案例: 基于SVM的异或数据集划分
5.3.1数据集及数据预处理
5.3.2构建SVM分类器
5.3.3案例结果及分析
第6章回归分析
6.1线性回归
6.1.1简单线性回归
6.1.2多元线性回归
6.2多项式回归
6.3正则化回归
6.3.1岭回归
6.3.2最小绝对收缩与选择算子
6.3.3弹性网络
6.4随机森林回归
6.5回归模型的性能评估
6.6回归模型的实现
6.6.1线性回归实现
6.6.2多项式回归实现
6.6.3正则化回归实现
6.6.4随机森林回归实现
6.7应用案例: 基于随机森林的房价预测
6.7.1数据集
6.7.2数据预处理
6.7.3随机森林回归模型建立
6.7.4案例结果及分析
第7章聚类分析
7.1聚类概述
7.1.1性能度量
7.1.2距离计算
7.2Kmeans算法
7.3层次聚类
7.4密度聚类
7.4.1DBSCAN相关概念
7.4.2DBSCAN算法流程
7.5应用案例
7.5.1Kmeans应用案例
7.5.2层次聚类应用案例
7.5.3DBSCAN应用案例
第8章神经网络与多层感知机
8.1神经元模型
8.2感知机原理及结构
8.2.1单层感知机
8.2.2多层感知机
8.2.3反向传播算法
8.3应用案例: 基于多层感知机的手写数字识别
8.3.1数据集及数据预处理
8.3.2三层感知机构建
8.3.3案例结果及分析
第二部分综合篇
第9章基于CNN的图像识别
9.1CNN的基本组成
9.1.1卷积运算基本过程
9.1.2多通道卷积
9.1.3池化
9.2CNN模型简介
9.3基于PyTorch构建CNN
9.4应用案例: 基于CNN的人脸性别识别
9.4.1数据集
9.4.2数据预处理
9.4.3搭建卷积神经网络
9.4.4案例结果及分析
第10章基于RNN的序列数据分类
10.1面向序列数据的机器学习
10.1.1RNN相关背景知识
10.1.2序列数据
10.1.3序列数据与建模
10.2RNN的常用网络结构
10.2.1基本结构
10.2.2简单循环网络模型
10.2.3门控算法模型
10.3基于PyTorch构建LSTM
10.4应用案例: 基于LSTM的文本分类
10.4.1数据准备
10.4.2模型构建和实现
10.4.3训练模型
10.4.4测试模型
第11章基于GNN的文本分类
11.1GNN基础
11.1.1GNN模型简介
11.1.2GCN模型简介
11.2GCN构建
11.2.1代码层次结构
11.2.2代码实现
11.3应用案例: 基于GCN的文本分类
11.3.1TextGCN介绍
11.3.2基于TextGCN的文本分类
11.3.3案例结果及分析
第12章基于GAN的图像生成
12.1GAN概述
12.1.1自编码器
12.1.2生成模型
12.1.3GAN基本原理
12.1.4GAN模型结构
12.1.5GAN的两种目标函数
12.1.6GAN的训练
12.2基于PyTorch构建GAN
12.2.1网络结构
12.2.2基于PyTorch建立GAN模型
12.3应用案例: 基于GAN的图像生成
12.3.1FashionMNIST数据集
12.3.2数据预处理
12.3.3搭建GAN模型
12.3.4案例结果及分析
第三部分拓展篇
第13章基于百度飞桨的车道线检测
13.1百度飞桨平台简介
13.2百度AI Studio平台简介
13.3使用AI Studio平台创建第一个项目
13.4应用案例: 车道线检测
13.4.1车道线检测数据集
13.4.2评价指标
13.4.3数据预处理
13.4.4模型构建
13.4.5训练和预测
第14章基于旷视天元MegEngine的目标检测
14.1旷视天元MegEngine平台简介
14.1.1MegEngine整体架构
14.1.2旷视天元平台特点
14.2MegEngine平台使用方法
14.2.1注册
14.2.2创建项目
14.3应用案例: 基于MegEngine的目标检测
14.3.1MSCOCO数据集
14.3.2目标检测评估指标
14.3.3模型训练与测试
第15章机器学习竞赛平台实践
15.1主流竞赛平台
15.1.1Kaggle竞赛
15.1.2天池大数据竞赛
15.2Kaggle竞赛实践
15.2.1应用案例1: 泰坦尼克之灾
15.2.2应用案例2: 细粒度犬种识别
15.2.3应用案例3: Home Depot产品相关性预测
15.3天池大数据竞赛实践
15.3.1应用案例1: 街景字符编码识别
15.3.2应用案例2: NLP新闻文本分类
15.3.3应用案例3: 贷款违约预测
参考文献