幫助中心 | 我的帳號 | 關於我們

強化學習

  • 作者:(英)菲爾·溫德爾|責編:劉熾|譯者:鄒偉//康俊鵬//王偉
  • 出版社:中國電力
  • ISBN:9787519869618
  • 出版日期:2023/02/01
  • 裝幀:平裝
  • 頁數:427
人民幣:RMB 128 元      售價:
放入購物車
加入收藏夾

內容大鋼
    強化學習將是未來十年在人工智慧領域的最大突破之一,強化學習演算法能夠使得智能體在環境中學習任意目標。這一令人興奮的發展打破了傳統機器學習的演算法約束。這本實用的書向數據科學和人工智慧專業人員展示了如何通過強化的手段使機器能夠自己學習。
    本書作者創辦了自己名字命名的研究型公司,本書涵蓋了從基本的構建模塊到最先進的實踐。通過本書,你將探索強化學習的當前狀態、關注工業應用、學習大量演算法,本書還有專門章節介紹如何將強化學習的解決方案部署到生產環節。這並不是一本隨用隨翻的工具書,書中包含很多數學知識,並期望讀者是熟悉機器學習的。
    學習強化學習是什麼,以及演算法如何解決具體問題。
    掌握強化學習的基礎知識,包括馬爾可夫決策過程、動態規劃和時間差分演算法。
    深入研究一系列基於值函數和政策梯度的演算法。
    應用先進的強化學習解決方案,如元學習、分層學習、多智能體、模仿學習等。
    了解最前沿的深度強化學習演算法,包括Rainbow、PPO、TD3、SAC等。
    通過本書專門的配套網站獲得實踐代碼和案例。

作者介紹
(英)菲爾·溫德爾|責編:劉熾|譯者:鄒偉//康俊鵬//王偉
    菲爾·溫德爾博士是一名多學科交叉的軟體工程師、作家和科技顧問,同時也是溫德研究所的CE0。該研究所主要提供雲計算科學咨詢,主營業務是幫助初創公司和大型企業改進數據流程、平台以及產品。作者于英國赫爾大學獲得電子工程碩士和博士學位,現居英國約克郡。

目錄
前言
第1章  強化學習概述
  1.1  為什麼現在就需要強化學習?
  1.2  機器學習
  1.3  強化學習
    1.3.1  什麼時候使用強化學習
    1.3.2  強化學習的應用場景
  1.4  強化學習的種類
    1.4.1  免模型學習或有模型學習
    1.4.2  智能體如何使用並更新它們的策略
    1.4.3  離散或連續的行為
    1.4.4  優化方法
    1.4.5  策略評估和改進
  1.5  強化學習的基本概念
    1.5.1  歷史上第一個強化學習演算法
    1.5.2  強化學習和機器學習是一種東西嗎?
    1.5.3  獎勵和反饋
  1.6  強化學習的發展簡史
  1.7  本章總結
  1.8  擴展閱讀
  1.9  參考文獻
第2章  馬爾可夫決策過程,動態規劃,蒙特卡洛方法
  2.1  多臂老虎機測試
    2.1.1  獎勵工程
    2.1.2  策略評估:價值函數
    2.1.3  策略改進:選擇*佳動作
    2.1.4  模擬環境
    2.1.5  運行實驗
    2.1.6  ε-貪婪演算法的改進
  2.2  馬爾可夫決策過程
    2.2.1  庫存控制
    2.2.2  庫存控制模擬
  2.3  策略與價值函數
    2.3.1  打折的獎勵
    2.3.2  用狀態–價值函數預測獎勵
    2.3.3  用動作值函數預測獎勵
    2.3.4  最優策略
  2.4  蒙特卡洛策略生成
  2.5  動態規劃的值迭代
    2.5.1  值迭代的過程
    2.5.2  數值迭代結果
  2.6  總結
  2.7  擴展閱讀
  2.8  參考文獻
第3章  時序差分學習,Q學習和n步演算法
  3.1  時序差分學習的相關公式
    3.1.1  Q學習
    3.1.2  SARSA
    3.1.3  Q學習與SARSA方法的對比
……

第4章  深度Q網路
第5章  梯度策略
第6章  超越策略梯度
第7章  用熵方法學習所有可能的策略
第8章  改進智能體的學習方式
第9章  強化學習實踐
第10章  強化學習的生產部署
第11章  結論與展望
附錄A  兩種動作的Logistic策略梯度
附錄B  Softmax的策略梯度

  • 商品搜索:
  • | 高級搜索
首頁新手上路客服中心關於我們聯絡我們Top↑
Copyrightc 1999~2008 美商天龍國際圖書股份有限公司 臺灣分公司. All rights reserved.
營業地址:臺北市中正區重慶南路一段103號1F 105號1F-2F
讀者服務部電話:02-2381-2033 02-2381-1863 時間:週一-週五 10:00-17:00
 服務信箱:bookuu@69book.com 客戶、意見信箱:cs@69book.com
ICP證:浙B2-20060032