TensorFlow2强化学习手册
深刻理解深度强化学习,基于TensorFlow探索现实世界中的强化学习。提供全书代码

作者:[美]普拉文·帕拉尼萨米(Praveen Palanisamy) 著 陈翔 王玺钧 译

丛书名:中外学者论AI

定价:99元

印次:1-1

ISBN:9787302643388

出版日期:2023.12.01

印刷日期:2023.11.06

图书责编:王芳

图书分类:零售

电子书
在线购买
分享
内容简介
作者简介
前言序言
资源下载
查看详情 查看详情 查看详情

本书首先介绍深度强化学习的基础知识以及TensorFlow 2.x的**主要版本。随后介绍OpenAI Gym、基于模型的RL和无模型的RL,并学习如何开发基本代理。深入介绍发现如何实施高级深度强化学习算法,例如行动者批评、深度确定性策略梯度、深度Q网络、近端策略优化以及深度循环Q网络,以训练RL代理。同时,本书通过构建用于自动完成任务的加密货币交易代理,股票/股票交易代理和智能代理等实例,探索现实世界中的强化学习。最后,本书介绍如何使用TensorFlow 2.x将深度强化学习代理部署到云并构建跨平台应用程序。

"陈翔,中山大学电子与信息工程学院教授,电子与信息工程实验教学中心副主任,深圳清华大学研究院兼职主任研究员,深圳空天通信终端应用技术工程实验室副主任。主要研究方向为5G移动通信与网络、卫星通信、软件无线电,在国内外知名期刊和会议上发表论文80余篇,获授权发明专利40余项,获2017年度中国电子学会优秀科技工作者称号。 王玺钧,中山大学电子与信息工程学院副教授。主要研究方向包括智能物联网、无人机通信和群智学习,发表论文90余篇,参撰著作1部,获授权发明专利40余项。 "

前 言 深度强化学习能够构建超越计算机视觉或感知的智能体、产品和服务来执行操作。TensorFlow 2.x 是最流行的深度学习框架的最新版本,用于开发和训练深度神经网络(Deep Neural Network,DNN)。 本书首先介绍了深度强化学习的基础知识和TensorFlow 2.x的最新主要版本。接下来的内容涵盖了OpenAI Gym、基于模型的强化学习和无模型的强化学习,以及学习如何开发基本智能体。接着,读者将了解如何实现高级的深度强化学习算法,如行动者-评论家、深度确定性策略梯度、深度Q网络、近端策略优化、深度循环Q网络和软行动者-评论家等算法,以训练强化学习智能体。读者还将通过构建加密货币交易智能体、股票/股份交易智能体和用于自动完成任务的智能体来探索现实世界中的强化学习。最后,读者将了解如何将深度强化学习智能体部署到云端,以及如何使用TensorFlow 2.x为Web端、移动端和其他平台构建跨平台应用程序。 通过本书,可以使用TensorFlow 2.x从头开始进行简单易懂的实现,读者可以更深入理解深度强化学习算法。 本书的目标读者 本书是面向希望使用TensorFlow 2.x从零开始构建、训练和部署自己的强化学习系统的机器学习应用开发者、人工智能和应用人工智能研究人员、数据科学家、深度学习从业者和了解强化学习基础知识的学生。 本书涵盖的内容 第1章,使用TensorFlow 2.x开发深度强化学习的基本模块,提供了为具有离散和连续动作空间的强化学习应用构建强化学习环境、基于深度神经网络的强化学习智能体、进化神经智能体以及其他基本模块的初...

目录
荐语
查看详情 查看详情

目   录

第 1 章  使用 TensorFlow 2.x 开发深度强化学习的基本模块  1

1.1 技术要求  1

1.2 构建训练强化学习智能体的环境和奖励机制  1

1.2.1 前期准备  2

1.2.2 实现步骤  2

1.2.3 工作原理  8

1.3 针对离散动作空间和离散决策问题实现基于神经网络的强化学习策略    8

1.3.1 前期准备  9

1.3.2 实现步骤  9

1.3.3 工作原理   13

1.4 针对连续动作空间和连续控制问题实现基于神经网络的强化学习策略  13

1.4.1 前期准备   14

1.4.2 实现步骤   14

1.4.3 工作原理   19

1.5 将 OpenAI Gym 作为强化学习的训练环境  20

1.5.1 前期准备   20

1.5.2 实现步骤   20

1.5.3 工作原理   22

1.6 构建神经网络智能体  22

1.6.1 前期准备   23

1.6.2 实现步骤   23

1.6.3 工作原理   26

1.7 构建神经网络进化智能体    27

1.7.1 前期准备   27

1.7.2 实现步骤   27

1.7.3 工作原理   34

1.8 参考资料    34

第 2 章  基于价值、策略和行动者-评论家的深度强化学习算法实现. 35

2.1 技术要求    35

2.2 构建用于训练强化学习智能体的随机环境   35

2.2.1 前期准备   36

2.2.2 实现步骤   37

2.2.3 工作原理   42

2... 查看详情

"通过本书,读者可以:
l使用全新的TensorFlow和Keras API从头开始构建深度强化学习智能体;
l使用最少代码实现先进的深度强化学习算法;
l在模拟环境中培训深度强化学习智能体,以执行加密货币、股票交易和建筑能源优化等现实世界的任务;
l使用TensorFlow创建桌面应用程序、云服务、Web和移动应用程序,将强化学习智能体部署到云端,构建跨平台应用程序;
使用分布式DNN模型训练加快代理开发。"

查看详情