图书目录

目录

第1章机器学习概述…………………………………………………………1

1.1什么是机器学习…………………………………………………………1

1.2机器学习的基本框架……………………………………………………2

1.3机器学习发展简史………………………………………………………5

1.4机器学习的流派…………………………………………………………7

1.4.1符号学派…………………………………………………………8

1.4.2贝叶斯学派………………………………………………………8

1.4.3连接学派………………………………………………………10

1.4.4进化仿生学派…………………………………………………11

1.4.5哪个学派更占主流……………………………………………12

1.5让人惊讶的学习…………………………………………………………13

1.5.1从猴子摘香蕉到星际大战……………………………………13

1.5.2集体学习的机器人……………………………………………14

1.5.3图片理解………………………………………………………16

1.5.4金融市场量化分析……………………………………………18

1.5.5AlphaGo………………………………………………………20

1.6机器学习技术的前沿……………………………………………………21

1.7机器智能会超过人类智能吗……………………………………………22

1.8机器学习基础……………………………………………………………23

1.81训练、验证与测试………………………………………………23

.

1.8.2参数过拟合、交叉验证与正则化………………………………24

1.8.3结构过拟合与模型选择………………………………………24 

@

1.8.4机器学习方法分类……………………………………………27

1.9开始你的机器学习之旅…………………………………………………29

1.9.1如何开始一个机器学习任务…………………………………29

1.9.2如何学习机器学习……………………………………………30

1.10相关资源………………………………………………………………30

第2章线性模型………………………………………………………………33

2.1线性预测模型……………………………………………………………33

2.1.1从多项式拟合说起……………………………………………34

2.1.2线性回归………………………………………………………36

2.1.3Fisher准则与线性分类………………………………………39

2.1.4Logistic回归…………………………………………………42

2.1.5小结……………………………………………………………44

2.2线性概率模型……………………………………………………………45

2.2.1主成分分析……………………………………………………46

2.2.2概率主成分分析………………………………………………47

2.2.3概率线性判别分析……………………………………………50

2.3贝叶斯方法………………………………………………………………52

2.4本章小结…………………………………………………………………54

2.5相关资源…………………………………………………………………55

第3章神经模型………………………………………………………………56

3.1神经网络概述……………………………………………………………57

3.1.1什么是人工神经网络…………………………………………58

3.1.2神经模型与其他方法…………………………………………58

3.2基于映射的神经模型……………………………………………………59

3.2.1从线性模型开始………………………………………………59

3.2.2多层感知器……………………………………………………62

3.2.3径向基函数网络………………………………………………67

3.2.4神经网络模型与先验知识……………………………………69

3.3基于记忆的神经模型……………………………………………………72

3.3.1Kohonen网络…………………………………………………73

3.3.2Hopfield网络…………………………………………………75

3.3.3玻尔兹曼机……………………………………………………78

3.3.4受限玻尔兹曼机………………………………………………81

?? 

目录

3.3.5自编码器………………………………………………………84

3.4基于过程的模型…………………………………………………………87

3.4.1ElmanRNN……………………………………………………88

3.4.2门网络…………………………………………………………89

3.4.3序列对序列网络………………………………………………93

3.4.4基于Attention模型的诗词生成………………………………95

3.5神经图灵机………………………………………………………………97

3.6本章小结…………………………………………………………………99

3.7相关资源………………………………………………………………100

第4章深度学习……………………………………………………………101

4.1从浅层学习到深度学习………………………………………………101

4.1.1网络表达能力…………………………………………………102

4.1.2层次表示与特征学习…………………………………………103

4.1.3显著特征的非监督学习………………………………………104

4.1.4复杂结构与数据驱动…………………………………………109

4.2深度神经网络训练……………………………………………………110

4.2.1基础训练算法…………………………………………………110

4.2.2DNN训练的困难……………………………………………116

4.2.3DNN训练技巧………………………………………………125

4.3神经网络的正则化……………………………………………………134

4.3.1结构化网络与参数共享………………………………………135

4.3.2范式约束与稀疏网络…………………………………………137

4.3.3加噪训练与数据增强…………………………………………140

4.3.4联合训练………………………………………………………140

4.3.5知识迁移………………………………………………………143

4.4生成模型下的深度学习………………………………………………145

4.4.1神经网络的简单概率表达……………………………………145

4.4.2后验拟合与VariationalAE…………………………………147

4.4.3VariationalRNN……………………………………………151

4.5计算图与复杂神经网络………………………………………………153

4.5.1由ChainRule到计算图……………………………………154

4.5.2基于计算图的参数优化………………………………………156

4.5.3计算图的模块化………………………………………………157

4.5.4计算图与深度神经网络………………………………………157

?? 

@

4.6计算平台与方法………………………………………………………160

4.6.1GPU与TPU…………………………………………………160

4.6.2并行计算………………………………………………………161

4.6.3模型压缩………………………………………………………167

4.7深度学习的应用………………………………………………………169

4.7.1语音信号处理…………………………………………………169

4.7.2自然语言处理…………………………………………………173

4.7.3计算机视觉……………………………………………………176

4.8本章小结………………………………………………………………179

4.9相关资源………………………………………………………………180

第5章核方法…………………………………………………………………181

5.1从线性回归到核方法…………………………………………………183

5.2核函数的性质…………………………………………………………184

5.2.1再生核希尔伯特空间与Mercer定理………………………184

5.2.2核函数的基本性质……………………………………………186

5.3常用核函数……………………………………………………………186

5.3.1简单核函数……………………………………………………187

5.3.2概率核…………………………………………………………188

5.3.3复杂对象上的核函数…………………………………………189

5.4KernelPCA……………………………………………………………195

5.5高斯过程………………………………………………………………197

5.6支持向量机……………………………………………………………199

5.6.1线性可分的SVM……………………………………………200

5.6.2线性不可分的SVM…………………………………………202

5.6.3v-SVM………………………………………………………204

5.6.4SVM的若干讨论……………………………………………205

5.7相关向量机……………………………………………………………206

5.8本章小结………………………………………………………………208

5.9相关资源………………………………………………………………209

第6章图模型…………………………………………………………………210

6.1概率图模型简介………………………………………………………211

6.2有向图模型……………………………………………………………212

6.2.1典型模型………………………………………………………212

?? 

目录

6.2.2有向图变量相关性判断………………………………………214

6.3无向图模型……………………………………………………………217

6.3.1无向图变量相关性判断………………………………………218

6.3.2有向图向无向图转化…………………………………………219

6.3.3有向图和无向图对比…………………………………………221

6.4常用概率图模型………………………………………………………221

6.4.1高斯混合模型…………………………………………………221

6.4.2隐马尔可夫模型………………………………………………225

6.4.3线性条件随机场………………………………………………229

6.5EM算法………………………………………………………………232

6.6精确推理算法…………………………………………………………235

6.6.1加和—乘积算法………………………………………………235

6.6.2树状图的加和—乘积算法……………………………………237

6.6.3联合树算法……………………………………………………238

6.7近似推理算法…………………………………………………………240

6.7.1采样法…………………………………………………………241

6.7.2变分法…………………………………………………………246

6.7.3采样法和变分法比较…………………………………………250

6.8本章小结………………………………………………………………250

6.9相关资源………………………………………………………………251

第7章无监督学习…………………………………………………………252

7.1无监督学习任务………………………………………………………253

7.1.1聚类概述………………………………………………………253

7.1.2流形学习概述…………………………………………………254

7.1.3因子学习………………………………………………………255

7.2聚类方法………………………………………………………………256

7.2.1基于划分的聚类方法…………………………………………256

7.2.2基于连接的聚类方法…………………………………………258

7.2.3基于密度的聚类方法…………………………………………262

7.2.4基于模型的聚类方法…………………………………………263

7.3流形学习………………………………………………………………264

7.3.1主成分分析……………………………………………………266

7.3.2多维标度………………………………………………………268

7.3.3ISOMAP……………………………………………………269

?? 

@

7.3.4自组织映射……………………………………………………271

7.3.5局部线性嵌入…………………………………………………273

7.3.6谱嵌入…………………………………………………………276

7.3.7t-SNE…………………………………………………………276

7.3.8流形学习方法比较……………………………………………279

7.4图模型与无监督学习…………………………………………………279

7.4.1图模型下的聚类任务…………………………………………279

7.4.2图模型下的流形学习…………………………………………280

7.4.3图模型下的因子学习…………………………………………281

7.5神经模型与无监督学习………………………………………………282

7.5.1特征学习任务中的因子学习…………………………………282

7.52生成任务中的因子学习………………………………………283

.

7.5.3分类/回归任务中的因子学习………………………………283

7.6本章小结………………………………………………………………285

7.7相关资源………………………………………………………………286

第8章非参数模型…………………………………………………………287

8.1简单非参数模型………………………………………………………288

8.2回顾高斯过程…………………………………………………………290

8.2.1高斯过程定义…………………………………………………290

8.2.2高斯过程回归…………………………………………………292

8.2.3高斯过程用于分类任务………………………………………296

8.3狄利克雷过程…………………………………………………………296

8.3.1回顾高斯混合模型……………………………………………297

8.3.2中国餐馆问题…………………………………………………298

8.3.3狄利克雷分布及性质…………………………………………300

8.3.4狄利克雷过程的定义…………………………………………302

8.3.5狄利克雷过程的表示…………………………………………303

8.3.6狄利克雷过程的构造…………………………………………307

8.3.7推理方法………………………………………………………309

8.3.8HierarchicalDP(HDP)………………………………………311

8.4本章小结………………………………………………………………312

8.5相关资源………………………………………………………………313

第9章演化学习……………………………………………………………315

9.1基于采样的优化方法…………………………………………………316

?? 

目录

9.1.1演化学习………………………………………………………316

9.1.2群体学习与随机优化…………………………………………317

9.2遗传算法………………………………………………………………318

9.2.1算法框架………………………………………………………319

9.2.2算法细节………………………………………………………320

9.2.3进化理论………………………………………………………324

9.3遗传编程………………………………………………………………328

9.3.1算法基础………………………………………………………328

9.3.2GP高级话题…………………………………………………333

9.3.3其他演化学习方法……………………………………………335

9.4群体学习方法…………………………………………………………336

9.4.1蚁群优化算法…………………………………………………337

9.4.2人工蜂群算法…………………………………………………338

9.4.3粒子群算法……………………………………………………340

9.4.4捕猎者搜索……………………………………………………341

9.4.5萤火虫算法……………………………………………………342

9.5随机优化方法…………………………………………………………342

9.5.1模拟退火算法…………………………………………………342

9.5.2杜鹃搜索………………………………………………………343

9.5.3和声搜索………………………………………………………344

9.5.4禁忌搜索………………………………………………………344

9.6本章小节………………………………………………………………345

9.7相关资源………………………………………………………………347

第10章强化学习……………………………………………………………348

10.1强化学习概述…………………………………………………………349

10.1.1什么是强化学习……………………………………………349

10.1.2与其他学习方法的区别……………………………………350

10.1.3强化学习的应用……………………………………………352

10.2强化学习的基本要素…………………………………………………353

10.2.1强化学习三元素……………………………………………353

10.2.2长期收益……………………………………………………353

10.2.3值函数与策略优化…………………………………………354

10.2.4通用策略迭代………………………………………………355

10.2.5强化学习算法分类…………………………………………356

ü

?? 

@

10.3值函数学习:基于模型的规划算法…………………………………358

10.3.1马尔可夫决策过程…………………………………………358

10.3.2MDP中的值函数……………………………………………360

10.3.3策略估值:动态规划算法……………………………………361

10.3.4策略优化:策略迭代和值迭代………………………………362

10.4值函数学习:基于采样的蒙特卡罗方法……………………………365

10.4.1学习任务与采样方法………………………………………365

10.4.2蒙特卡罗策略估值…………………………………………365

10.4.3蒙特卡罗策略优化…………………………………………367

10.5值函数学习:基于采样的时序差分方法……………………………370

10.5.1基于TD的策略估值………………………………………370

10.5.2基于TD的策略优化………………………………………372

10.5.3N-stepTD与TD(λ)………………………………………374

10.5.4三种值函数学习方法总结…………………………………375

10.6模型学习………………………………………………………………377

10.6.1值函数学习与模型学习……………………………………377

10.6.2模型学习方法………………………………………………378

10.6.3Dyna:混合学习方法………………………………………379

10.7函数近似与策略学习…………………………………………………380

10.7.1值函数近似…………………………………………………381

10.7.2基于梯度的参数优化………………………………………383

10.7.3基于函数近似的策略学习…………………………………383

10.7.4Actor-Critic方法……………………………………………385

10.8深度强化学习方法……………………………………………………386

10.8.1Atari游戏……………………………………………………387

10.8.2AlphaGo……………………………………………………388

10.9本章小结………………………………………………………………391

10.10相关资源……………………………………………………………391

第11章优化方法……………………………………………………………393

11.1函数优化………………………………………………………………394

11.1.1优化问题定义………………………………………………394

11.1.2优化问题分类………………………………………………395

11.1.3基础定理……………………………………………………395

11.2无约束优化问题………………………………………………………396

y

?? 

目录

11.2.1线性搜索……………………………………………………396

11.2.2置信域优化…………………………………………………401

11.3带约束优化问题………………………………………………………404

11.3.1拉格朗日乘子法……………………………………………405

11.3.2对偶问题……………………………………………………407

11.3.3线性规划……………………………………………………409

11.3.4二阶规划……………………………………………………415

11.3.5一般非线性优化……………………………………………420

11.4本章小结………………………………………………………………425

11.5相关资源………………………………………………………………426

参考文献…………………………………………………………………………427

t

??