强化学习
提供课件、咨询QQ:2301891038(仅限教师)。理论讲解+案例实战+前沿成果

作者:柯良军、王小强

丛书名:中外学者论AI

定价:69元

印次:1-1

ISBN:9787302532408

出版日期:2019.12.01

印刷日期:2019.11.15

图书责编:王芳

图书分类:零售

电子书
在线购买
分享
内容简介
作者简介
前言序言
资源下载
查看详情 查看详情 查看详情

本书介绍强化学习原理、算法及其实现。内容涉及基于模型的强化学习、基于采样-估计的强化学习、基于逼 近理论的强化学习及深度强化学习等。 本书以教学为目标进行选材,力求阐述严谨、重点突出、深入浅出,以便于教学与自学。 本书面向所有对强化学习感兴趣的读者,可作为高等学校理工科高年级本科生、研究生强化学习课程教材或 参考书。

本书旨在帮助读者在短时间内理解和运用强化学习。本书的主要特点是:点明问题,以问题为驱动组织内容;注重解释算 法的原理;语言力求简练与严谨。

强化学习是人工智能的核心内容之一。掌握强化学习需要概率与统计、运筹学、泛函分析等数学知识,而且强化学习发展迅速、知识更新快,这导致学习强化学习是一件有挑战性的事。本书旨在帮助读者在短时间内理解和运用强化学习。 本书的主要特点是:点明问题,以问题为驱动组织内容;注重解释算法的原理;语言力求简练与严谨。 本书主要包括以下内容:基于模型的强化学习、基于采样 -估计的强化学习、基于逼近理论的强化学习和深度强化学习。前三部分主要参考 Richard S. Sutton和 Andrew G. Barto的书 Reinforcement Learning: An Introduction以及 David Silver的课件。第四部分的深度学习参考了吴恩达的深度学习公开课以及 David Silver的深度强化学习讲义和相关论文。多智能体强化学习主要参考 Wang Jun等的论文。本书内容由柯良军统稿,王小强整理并解读了部分程序。在写作过程中,作者参考了《机器学习》《强化学习数学基础》以及《深入浅出强化学习》等相关书籍;同时,作者也大量阅读了网络资料。本书在吕同富的 Latex模板基础上用 TexLive写作。在此,作者对以上所有人员表示感谢!本书得到国家自然科学基金项目(编号: 61573277)的资助,在此表示诚挚感谢! 作者综合各种素材重新组织内容,从不同的视角将强化学习呈现给读者,衷心希望读者开卷有益! 柯良军 2019年 11月

目录
荐语
查看详情 查看详情
第 1章绪论. 1 

1.1引言 . 1 

1.2解决复杂问题的朴素思想 . 3 

1.2.1数学建模与优化  4 

1.2.2采样和估计 . 4 

1.2.3逼近 . 5 

1.2.4迭代 . 5 

1.3强化学习简史 . 7 

1.4本书主要内容及结构 . 7 

1.5小结 . 8 

1.6习题 . 9

参考文献  9

第 2章基础知识 .10 

2.1运筹学简明基础 .10 

2.1.1无约束非线性规划优化方法 11 

2.1.2 KKT条件 .13 

2.1.3凸规划的性质 13 

2.2概率与统计简明基础 14 

2.2.1概率论基本概念 .14 

2.2.2概率论的收敛定理 16 

2.2.3统计学的基本概念 17 

2.2.4最大似然估计法 .17 

2.2.5估计量的优良性评估 18 

2.2.6采样与随机模拟 .19 

2.2.7 Monte Carlo方法简介 .20 

2.2.8重要采样法 21 

2.3小结 22 

2.4习题 23

参考文献 .23

第一一篇

基于于模模型型的的强强化化学学习

一篇基

于模型的强化学习

第 3章多摇臂问题26 

3.1动作值方法 27 

3.2非平稳多摇臂问题 28 

3.3 UCB动作选择 .29 

3.4梯度摇臂算法 30 

3.5习题 30

参考文献 .30

第 4章 Markov决策过程... 查看详情

本书旨在帮助读者在短时间内理解和运用强化学习。本书的主要特点是:点明问题,以问题为驱动组织内容;注重解释算 法的原理;语言力求简练与严谨。 查看详情