幫助中心 | 我的帳號 | 關於我們

基於Python的強化學習

  • 作者:(美)安德里亞·隆薩|責編:劉熾|譯者:劉繼紅//王瑞文
  • 出版社:中國電力
  • ISBN:9787519870379
  • 出版日期:2023/01/01
  • 裝幀:平裝
  • 頁數:265
人民幣:RMB 88 元      售價:
放入購物車
加入收藏夾

內容大鋼
    本書首先介紹在強化學習環境中工作所需的工具、庫和設置,涵蓋了強化學習的構成模塊,深入探討基於值的方法,如Q-learning和SARSA演算法的應用。讀者將學習如何結合使用Q-learning和神經網路來解決複雜問題。此外,在學習DDPG和TD3確定性演算法之前,讀者將學習策略梯度方法,如TRPO和PPO,以提高性能和穩定性。本書還介紹模仿學習的原理,以及Dagger如何教智能體飛行。讀者將探索進化策略和黑盒優化技術。最後,讀者將掌握探索方法,如UCB和UCB1,並開發一個名為ESBAS的元演算法。
    如果你是人工智慧研究者、深度學慣用戶,或者希望從頭開始學習強化學習的人,那麼這本書就很適合你。如果你想了解該領域的進展,也會發現這本書很有幫助。當然,Python的基礎知識是必需的。

作者介紹
(美)安德里亞·隆薩|責編:劉熾|譯者:劉繼紅//王瑞文
    安德里亞·隆薩是一名深度學習工程師,對人工智慧懷有極大的熱情,渴望創造出具有智能行為的機器。他通過理論性的和工業應用性的機器學習項目獲得了強化學習、自然語言處理和電腦視覺方面的專業知識。他還參加過幾次Kaggle比賽,並取得了很好的成績。他總是在尋找引人入勝的挑戰,並喜歡證明自己。

目錄
前言
第一部分  演算法與環境
第l章  強化學習概貌
  1.1  強化學習導論
    1.1.1  比較強化學習和監督學習
    1.1.2  強化學習的歷史
    1.1.3  深度強化學習
  1.2  強化學習的要素
    1.2.1  策略
    1.2.2  值函數
    1.2.3  回報(獎勵)
    1.2.4  模型
  1.3  強化學習的應用
    1.3.1  遊戲
    1.3.3  機器學習
    1.3.4  經濟學與金融
    1.3.5  醫療健康
    1.3.6  智能交通系統
    1.3.7  能源優化與智能電網
  1.4  本章小結
  1.5  思考題
  1.6  延伸閱讀
第2章  強化學習過程與OpenAI Gym
  2.1  環境設置
    2.1.1  安裝OpenAI Gym
    2.1.2  安裝Roboschool
  2.2  OpenAI Gym和強化學習過程
    2.2.1  開發強化學習過程
    2.2.2  了解空間概念
  2.3  利用TesorFlow開發強化學習模型
    2.3.1  張量
    2.3.2  創建計算圖
    2.3.3  線性回歸示例
  2.4  TensorBoard介紹
  2.5  強化學習環境
    2.5.1  為什麼需要不同的環境
    2.5.2  開源環境
  2.6  本章小結
  2.7  思考題
  2.8  延伸閱讀
第3章  基於動態規劃的問題求解
  3.1  馬爾可夫決策過程
    3.1.1  策略
    3.1.2  回報
    3.1.3  值函數
    3.1.4  貝爾曼方程
  3.2  強化學習演算法的類別
    3.2.1  無模型演算法
    3.2.2  基於模型的強化學習
    3.2.3  演算法多樣性

  3.3  動態規劃
    3.3.1  策略評價與策略改進
    3.3.2  策略迭代
    3.3.3  值迭代
  3.4  本章小結
  3.5  思考題
  3.6  延伸閱讀
……
第二部分  無模型強化學習演算法
第三部分  超越無模型演算法
附錄  思考題參考答案

  • 商品搜索:
  • | 高級搜索
首頁新手上路客服中心關於我們聯絡我們Top↑
Copyrightc 1999~2008 美商天龍國際圖書股份有限公司 臺灣分公司. All rights reserved.
營業地址:臺北市中正區重慶南路一段103號1F 105號1F-2F
讀者服務部電話:02-2381-2033 02-2381-1863 時間:週一-週五 10:00-17:00
 服務信箱:bookuu@69book.com 客戶、意見信箱:cs@69book.com
ICP證:浙B2-20060032