首页 > 图书中心 >图书详情
深度强化学习图解
作者:[美]米格尔·莫拉莱斯(Miguel Morales)著 郭涛 译
定价:139元
印次:1-3
ISBN:9787302605461
出版日期:2022.07.01
印刷日期:2023.12.13
我们在与环境交互的过程中进行学习,经历的奖励或惩罚将指导我们未来的行为。深度强化学习将该过程引入人工智能领域,通过分析结果来寻找最有效的前进方式。DRL智能体可提升营销效果、预测股票涨跌,甚至击败**围棋高手和国际象棋大师。 《深度强化学习图解》呈现生动示例,指导你构建深度学习体系。Python代码包含详明、直观的注释,助你深刻理解DRL技术。你将学习算法的运行方式,并学会用评估性反馈来开发自己的DRL智能体。 本书主要内容包括: ●强化学习入门 ●行为与人类似的DRL智 能体 ●在复 杂情况下应用DRL
more >前 言 本书是深度强化学习理论与实践的桥梁。本书内容适用于熟悉机器学习技术,想要学习强化学习的读者。本书开篇将介绍深度强化学习的基础知识。随后深入探索深度强化学习的算法和技术,最后会提供一份具有潜在影响力的先进技术调查。 本书适用对象 熟悉深度强化学习领域、Python代码、一些数学知识,能够运用大量直观解释和有趣而具体的例子来推动学习的人,会喜欢本书。此外,任何熟悉Python的人都能学习到很多知识。即使DL知识不扎实,本书也能帮助读者对神经网络和反向传播及相关技术进行简单复习。最重要的是,本书不依赖于其他书,任何想简单了解AI智能体和深度强化学习的读者都能通过阅读本书达到目的。 本书结构 本书共13章,大致可分为两部分,前一部分包括1~5章,后一部分包括6~ 13章。 第1章是深度强化学习导论,介绍深度强化学习的概念,讲述本书的最佳使用方式。第2章涵盖强化学习的概念、数学基础和多智能体强化学习框架等内容。第3章通过最佳行为策略算法来解决惯序决策问题,学习妥善平衡短期目标与长期目标的方法。第4章以多臂老虎机为例,探索策略,来解决未知转换函数与奖励信号的问题,合理权衡信息收集与信息运用。第5章评估智能体的行为。第6章介绍在转换函数和奖励函数未知的情况下,构造强化学习环境中的优化策略,训练优化的智能体行为。第7章讲述如何基于动态规划思想来优化强化学习,从而获得更高效的实现目标。第8章介绍基于价值的深度强化学习。第9章探索函数逼近和基于价值的深度强化学习。第10章探索高效抽样的价值深度强化学习方法。第11章探索策略梯度和actor-critic方法。第12章探索高级actor-critic方法。第13章讨论通用人工智能的未来发展方向。 关于代码 本书在“Python讲解”栏目中列举了许多源代码示例。源代码使用等宽字体进行格式化,这样就可与普通文本区分开,并添加有序的高亮突出显示,这样能使它更易于阅读。 大多数情况下,原始源代码已被重新格式化,本书添加了换行符、重命名变量并重新调整了缩进,以适应书中可用的页面空间。即使如此,在极少数情况下页面空间也还不够,Python中包括行连续操作符代码,即反斜杠 (\),指示语句在下一行继续。 此外,源代码中的注释经常会被删除,文本仅描述代码。代码注释指出重要的概念。 可扫描封底二维码下载本书的示例代码。
more >