同類熱銷排行榜

基於Python的強化學習

作者：(美)安德里亞·隆薩|責編:劉熾|譯者:劉繼紅//王瑞文
出版社：中國電力
ISBN：9787519870379

出版日期：2023/01/01
裝幀：平裝
頁數：265

人民幣：RMB 88 元售價：元

內容大鋼

本書首先介紹在強化學習環境中工作所需的工具、庫和設置，涵蓋了強化學習的構成模塊，深入探討基於值的方法，如Q-learning和SARSA演算法的應用。讀者將學習如何結合使用Q-learning和神經網路來解決複雜問題。此外，在學習DDPG和TD3確定性演算法之前，讀者將學習策略梯度方法，如TRPO和PPO，以提高性能和穩定性。本書還介紹模仿學習的原理，以及Dagger如何教智能體飛行。讀者將探索進化策略和黑盒優化技術。最後，讀者將掌握探索方法，如UCB和UCB1，並開發一個名為ESBAS的元演算法。
如果你是人工智慧研究者、深度學慣用戶，或者希望從頭開始學習強化學習的人，那麼這本書就很適合你。如果你想了解該領域的進展，也會發現這本書很有幫助。當然，Python的基礎知識是必需的。

作者介紹

(美)安德里亞·隆薩|責編:劉熾|譯者:劉繼紅//王瑞文
安德里亞·隆薩是一名深度學習工程師，對人工智慧懷有極大的熱情，渴望創造出具有智能行為的機器。他通過理論性的和工業應用性的機器學習項目獲得了強化學習、自然語言處理和電腦視覺方面的專業知識。他還參加過幾次Kaggle比賽，並取得了很好的成績。他總是在尋找引人入勝的挑戰，並喜歡證明自己。

前言
第一部分  演算法與環境
第l章  強化學習概貌
  1.1  強化學習導論
    1.1.1  比較強化學習和監督學習
    1.1.2  強化學習的歷史
    1.1.3  深度強化學習
  1.2  強化學習的要素
    1.2.1  策略
    1.2.2  值函數
    1.2.3  回報(獎勵)
    1.2.4  模型
  1.3  強化學習的應用
    1.3.1  遊戲
    1.3.3  機器學習
    1.3.4  經濟學與金融
    1.3.5  醫療健康
    1.3.6  智能交通系統
    1.3.7  能源優化與智能電網
  1.4  本章小結
  1.5  思考題
  1.6  延伸閱讀
第2章  強化學習過程與OpenAI Gym
  2.1  環境設置
    2.1.1  安裝OpenAI Gym
    2.1.2  安裝Roboschool
  2.2  OpenAI Gym和強化學習過程
    2.2.1  開發強化學習過程
    2.2.2  了解空間概念
  2.3  利用TesorFlow開發強化學習模型
    2.3.1  張量
    2.3.2  創建計算圖
    2.3.3  線性回歸示例
  2.4  TensorBoard介紹
  2.5  強化學習環境
    2.5.1  為什麼需要不同的環境
    2.5.2  開源環境
  2.6  本章小結
  2.7  思考題
  2.8  延伸閱讀
第3章  基於動態規劃的問題求解
  3.1  馬爾可夫決策過程
    3.1.1  策略
    3.1.2  回報
    3.1.3  值函數
    3.1.4  貝爾曼方程
  3.2  強化學習演算法的類別
    3.2.1  無模型演算法
    3.2.2  基於模型的強化學習
    3.2.3  演算法多樣性

  3.3  動態規劃
    3.3.1  策略評價與策略改進
    3.3.2  策略迭代
    3.3.3  值迭代
  3.4  本章小結
  3.5  思考題
  3.6  延伸閱讀
……
第二部分  無模型強化學習演算法
第三部分  超越無模型演算法
附錄  思考題參考答案

Δ訂單支付
付款方式
運費計算方式

Δ關於我們
關於美商天龍
聯絡我們

首頁│ 新手上路│ 客服中心│ 關於我們│ 聯絡我們│ Top↑│
Copyrightc 1999~2008 美商天龍國際圖書股份有限公司臺灣分公司. All rights reserved.
營業地址:臺北市中正區重慶南路一段103號1F 105號1F-2F
讀者服務部電話：02-2381-2033 02-2381-1863　時間：週一-週五 10:00-17:00
　服務信箱：bookuu@69book.com 客戶、意見信箱:cs@69book.com
ICP證：浙B2-20060032

同類熱銷排行榜

最近瀏覽的商品

基於Python的強化學習