幫助中心 | 我的帳號 | 關於我們

深度強化學習圖解

  • 作者:(美)米格爾·莫拉萊斯|責編:王軍|譯者:郭濤
  • 出版社:清華大學
  • ISBN:9787302605461
  • 出版日期:2022/07/01
  • 裝幀:平裝
  • 頁數:408
人民幣:RMB 139 元      售價:
放入購物車
加入收藏夾

內容大鋼
    我們在與環境交互的過程中進行學習,經歷的獎勵或懲罰將指導我們未來的行為。深度強化學習將該過程引入人工智慧領域,通過分析結果來尋找最有效的前進方式。DRL智能體可提升營銷效果、預測股票漲跌,甚至擊敗頂尖圍棋高手和國際象棋大師。
    《深度強化學習圖解》呈現生動示例,指導你構建深度學習體系。Python代碼包含詳明、直觀的註釋,助你深刻理解DRL技術。你將學習演算法的運行方式,並學會用評估性反饋來開發自己的DRL智能體。
    本書主要內容包括:
    強化學習入門;
    行為與人類似的DRL智能體;
    在複雜情況下應用DRL。
    本書適用於具有基礎深度學習經驗的開發者。

作者介紹
(美)米格爾·莫拉萊斯|責編:王軍|譯者:郭濤

目錄
第1章  深度強化學習導論
  1.1  深度強化學習概念
    1.1.1  深度強化學習:人工智慧的機器學習法
    1.1.2  深度強化學習著重創建電腦程序
    1.1.3  智能體解決智能問題
    1.1.4  智能體通過試錯提高性能
    1.1.5  智能體從慣序性反饋中學習
    1.1.6  智能體從評估性反饋中學習
    1.1.7  智能體從抽樣性反饋中學習
    1.1.8  智能體使用強大的非線性函數逼近
  1.2  深度強化學習的過去、現在與未來
    1.2.1  人工智慧和深度強化學習的發展簡史
    1.2.2  人工智慧的寒冬
    1.2.3  人工智慧現狀
    1.2.4  深度強化學習進展
    1.2.5  未來的機遇
  1.3  深度強化學習的適用性
    1.3.1  利弊分析
    1.3.2  深度強化學習之利
    1.3.3  深度強化學習之弊
  1.4  設定明確的雙向預期
    1.4.1  本書的預期
    1.4.2  本書的最佳使用方式
    1.4.3  深度強化學習的開發環境
  1.5  小結
第2章  強化學習數學基礎
  2.1  強化學習組成
    2.1.1  問題、智能體和環境的示例
    2.1.2  智能體:決策者
    2.1.3  環境:其餘一切
    2.1.4  智能體與環境交互循環
  2.2  MDP:環境的引擎
    2.2.1  狀態:環境的特定配置
    2.2.2  動作:影響環境的機制
    2.2.3  轉換函數:智能體行為的後果
    2.2.4  獎勵信號:胡蘿蔔和棍棒
    2.2.5  視界:時間改變最佳選擇
    2.2.6  折扣:未來是不確定的,別太看重它
    2.2.7  MDP擴展
    2.2.8  總體回顧
  2.3  小結
第3章  平衡短期目標與長期目標
  3.1  決策智能體的目標
    3.1.1  策略:各狀態動作指示
    3.1.2  狀態-值函數:有何期望
    3.1.3  動作-值函數:如果這樣做,有何期望
    3.1.4  動作-優勢函數:如果這樣做,有何進步
    3.1.5  最優性
  3.2  規劃最優動作順序
    3.2.1  策略評估:評級策略

    3.2.2  策略改進:利用評級得以改善
    3.2.3  策略迭代:完善改進后的行為
    3.2.4  價值迭代:早期改進行為
  3.3  小結
第4章  權衡信息收集和運用
  4.1  解讀評估性反饋的挑戰
    4.1.1  老虎機:單狀態決策問題
    4.1.2  後悔值:探索的代價
……
第5章  智能體行為評估
第6章  智能體行為的優化
第7章  更有效、更高效地完成目標
第8章  基於價值的深度強化學習
第9章  更穩定的基於價值方法
第10章  高效抽樣的基於價值學習方法
第11章  策略梯度與actor-critic方法
第12章  高級actor-critic方法
第13章  邁向通用人工智慧

  • 商品搜索:
  • | 高級搜索
首頁新手上路客服中心關於我們聯絡我們Top↑
Copyrightc 1999~2008 美商天龍國際圖書股份有限公司 臺灣分公司. All rights reserved.
營業地址:臺北市中正區重慶南路一段103號1F 105號1F-2F
讀者服務部電話:02-2381-2033 02-2381-1863 時間:週一-週五 10:00-17:00
 服務信箱:bookuu@69book.com 客戶、意見信箱:cs@69book.com
ICP證:浙B2-20060032