幫助中心 | 我的帳號 | 關於我們

TensorFlow2強化學習手冊/中外學者論AI

  • 作者:(美)普拉文·帕拉尼薩米|責編:王芳|譯者:陳翔//王璽鈞
  • 出版社:清華大學
  • ISBN:9787302643388
  • 出版日期:2023/12/01
  • 裝幀:平裝
  • 頁數:331
人民幣:RMB 99 元      售價:
放入購物車
加入收藏夾

內容大鋼
    深度強化學習能夠構建智能體、產品和服務,超越電腦視覺或感知執行動作。TensorFlow 2.x是最流行的深度學習框架的最新主要版本,用於開發和訓練深度神經網路。
    本書介紹了深度強化學習的基本原理和TensorFlow的最新版本,同時也介紹了OpenAl Gym、基於模型和無模型的強化學習,並學習如何開發基本智能體。同時給出了高級深度強化學習演算法(Actor-Critic、深度確定性策略梯度、深度Q網路、近端策略優化和深度遞歸Q網路等)的實現。

作者介紹
(美)普拉文·帕拉尼薩米|責編:王芳|譯者:陳翔//王璽鈞

目錄
第1章  使用TensorFlow 2.x開發深度強化學習的基本模塊
  1.1  技術要求
  1.2  構建訓練強化學習智能體的環境和獎勵機制
    1.2.1  前期準備
    1.2.2  實現步驟
    1.2.3  工作原理
  1.3  針對離散動作空間和離散決策問題實現基於神經網路的強化學習策略
    1.3.1  前期準備
    1.3.2  實現步驟
    1.3.3  工作原理
  1.4  針對連續動作空間和連續控制問題實現基於神經網路的強化學習策略
    1.4.1  前期準備
    1.4.2  實現步驟
    1.4.3  工作原理
  1.5  將OpenAI Gym作為強化學習的訓練環境
    1.5.1  前期準備
    1.5.2  實現步驟
    1.5.3  工作原理
  1.6  構建神經網路智能體
    1.6.1  前期準備
    1.6.2  實現步驟
    1.6.3  工作原理
  1.7  構建神經網路進化智能體
    1.7.1  前期準備
    1.7.2  實現步驟
    1.7.3  工作原理
  1.8  參考資料
第2章  基於價值、策略和行動者-評論家的深度強化學習演算法實現
  2.1  技術要求
  2.2  構建用於訓練強化學習智能體的隨機環境
    2.2.1  前期準備
    2.2.2  實現步驟
    2.2.3  工作原理
  2.3  構建基於價值的強化學習智能體演算法
    2.3.1  前期準備
    2.3.2  實現步驟
    2.3.3  工作原理
  2.4  實現時序差分學習
    2.4.1  前期準備
    2.4.2  實現步驟
    2.4.3  工作原理
  2.5  構建強化學習中的蒙特卡洛預測和控制演算法
    2.5.1  前期準備
    2.5.2  實現步驟
    2.5.3  工作原理
  2.6  實現SARSA演算法和對應的強化學習智能體
    2.6.1  前期準備
    2.6.2  實現步驟
    2.6.3  工作原理
  2.7  構建基於Q學習的智能體

    2.7.1  前期準備
    2.7.2  實現步驟
    2.7.3  工作原理
  2.8  實現策略梯度
    2.8.1  前期準備
    2.8.2  實現步驟
    2.8.3  工作原理
  2.9  實現行動者-評論家演算法
    2.9.1  前期準備
    2.9.2  實現步驟
    2.9.3  工作原理
第3章  高級強化學習演算法的實現
第4章  現實世界中的強化學習——構建加密貨幣交易智能體
第5章  現實世界中的強化學習——建立股票/股份交易智能體
第6章  現實世界中的強化學習——構建智能體來完成您的待辦事項
第7章  在雲端部署深度強化學習智能體
第8章  使用分散式訓練加速深度強化學習智能體開發
第9章  深度強化學習智能體的多平台部署

  • 商品搜索:
  • | 高級搜索
首頁新手上路客服中心關於我們聯絡我們Top↑
Copyrightc 1999~2008 美商天龍國際圖書股份有限公司 臺灣分公司. All rights reserved.
營業地址:臺北市中正區重慶南路一段103號1F 105號1F-2F
讀者服務部電話:02-2381-2033 02-2381-1863 時間:週一-週五 10:00-17:00
 服務信箱:bookuu@69book.com 客戶、意見信箱:cs@69book.com
ICP證:浙B2-20060032