图书目录

目录

配套资源

第1章人工智能与深度学习概述

视频讲解: 17分钟,3集

1.1人工智能与机器学习

1.1.1人工智能的发展历程

1.1.2机器学习及深度学习的发展历程

1.1.3人工智能与机器学习及深度学习的关系

1.2机器学习的分类

1.2.1监督学习

1.2.2非监督学习

1.2.3半监督学习

1.2.4强化学习

1.3深度学习的分类

1.3.1深度神经网络

1.3.2卷积神经网络

1.3.3其他深度神经网络

1.4深度学习与强化学习的结合

1.4.1强化学习

1.4.2强化学习算法分类

1.4.3深度强化学习

本章小结

第2章机器学习之回归任务

视频讲解: 12分钟,1集

2.1机器学习基础

2.2一元线性回归

2.3解析法实现一元线性回归

2.4解析法实现多元线性回归

2.4.1建立模型

2.4.2编程实现

2.5梯度下降法的基本原理

2.6梯度下降法求解线性回归

2.6.1求解一元线性回归

2.6.2求解多元线性回归

2.7TensorFlow实现梯度下降法

2.7.1TensorFlow的自动求导机制

2.7.2自动求导实现一元线性回归的梯度下降

2.7.3自动求导实现多元线性回归的梯度下降

本章小结

第3章机器学习之分类任务

视频讲解: 14分钟,2集

3.1分类任务与逻辑回归

3.1.1广义线性回归

3.1.2逻辑回归实现二分类

3.1.3交叉熵损失函数

3.1.4TensorFlow实现一元逻辑回归

3.1.5TensorFlow实现多元逻辑回归

3.2模型评估

3.3多分类任务

本章小结

第4章神经网络与深度学习

视频讲解: 11分钟,2集

4.1神经元与感知机

4.2单层神经网络的设计与实现

4.3深度学习

4.3.1多层神经网络

4.3.2机器学习与深度学习对比

4.3.3误差反向传播算法

4.3.4激活函数

4.4实例: 深度学习模型完成分类任务

本章小结

第5章深度神经网络的训练方法

视频讲解: 12分钟,3集

5.1梯度下降算法的优化

5.1.1梯度下降算法的问题

5.1.2基于动量的更新 

5.1.3二阶优化方法

5.1.4共轭梯度

5.2自适应学习率算法

5.2.1学习率衰减

5.2.2AdaGrad算法

5.2.3RMSProp算法

5.2.4AdaDelta算法

5.2.5Adam算法

5.2.6几种常见优化算法的比较

5.3参数初始化

5.3.1合理初始化的重要性

5.3.2随机初始化

5.3.3Xavier初始化

5.3.4He初始化

5.3.5批量归一化

5.3.6预训练

5.4Sequential模型搭建和训练神经网络

5.5实例: 深度神经网络实现手写数字识别

本章小结

第6章卷积神经网络

视频讲解: 37分钟,6集

6.1计算机视觉问题

6.1.1图像分类

6.1.2目标定位

6.1.3目标检测

6.1.4图像分割

6.2图像卷积及卷积神经网络

6.2.1图像卷积

6.2.2池化和感受野

6.2.3基本网络结构

6.3实例: 卷积神经网络实现手写数字识别

6.4卷积神经网络的优化方法

6.4.1数据增强

6.4.2随机丢弃

6.4.3级联卷积

6.4.4集成学习

6.5实例: 卷积神经网络识别CIFAR10数据

6.6实例: 基于DeepLabV3+模型的轨道图像分割

本章小结

第7章典型的深度神经网络模型

视频讲解: 38分钟,5集

7.1卷积神经网络的发展

7.2经典网络LeNet

7.2.1LeNet结构

7.2.2实例: 搭建LeNet模型实现数字识别

7.2.3实例: 搭建LeNet模型实现CIFAR10识别

7.3AlexNet模型

7.3.1AlexNet结构

7.3.2实例: 搭建AlexNet模型实现图片分类

7.4VGGNet模型

7.4.1VGGNet结构

7.4.2实例: 搭建VGG16模型

7.5GoogLeNet模型

7.6ResNet模型

7.7循环神经网络

7.7.1RNN结构

7.7.2实例: RNN用于时序数据预测

本章小结

第8章强化学习算法

8.1强化学习综述

8.1.1目标、单步奖励与累积回报 

8.1.2马尔可夫决策过程

8.1.3值函数与最优值函数

8.2动态规划方法

8.2.1策略迭代

8.2.2值迭代

8.3基于值函数的强化学习算法

8.3.1基于蒙特卡洛的强化学习算法

8.3.2基于时间差分的强化学习算法

8.3.3TDλ算法

8.4基于策略梯度的强化学习算法

8.4.1何时应用基于策略的学习方法

8.4.2策略梯度详解

8.4.3蒙特卡洛策略梯度算法

8.4.4ActorCritic算法

8.5实例

8.5.1值迭代算法实例

8.5.2SARSA算法实例

8.5.3蒙特卡洛算法实例

8.5.4TDLearning算法实例

8.5.5QLearning算法实例

本章小结

第9章深度强化学习

9.1基于值函数的深度强化学习

9.1.1深度Q学习

9.1.2深度Q学习的衍生方法

9.2基于策略梯度的深度强化学习

9.2.1深度确定性策略梯度算法

9.2.2异步深度强化学习算法

9.3实例

9.3.1DDPG实现pendulumv0实例

9.3.2DDPG实现CartPolev0实例

9.3.3DDPG实现MountainCarv0实例

本章小结