幫助中心 | 我的帳號 | 關於我們

基於模型的強化學習

  • 作者:(伊朗)米拉德·法爾西//劉俊|責編:張燁|譯者:高藝//夏宇翔//陳鋒//劉攀成//鍾家華等
  • 出版社:東南大學
  • ISBN:9787576610444
  • 出版日期:2024/07/01
  • 裝幀:平裝
  • 頁數:236
人民幣:RMB 98 元      售價:
放入購物車
加入收藏夾

內容大鋼
    強化學習是機器學習的一個基本范示,其中智能體執行動作以確保設備的最優性能。雖然這種機器學習範式近年來取得了巨大的成功和普及,但以前的學術研究要麼集中在理論上(最優控制和動態規劃),要麼集中在演算法上,其中大多數是基於模擬的。
    《基於模型的強化學習》提供了一個基於模型的框架來橋接這兩個方面,從而創建了一個基於模型的在線學習控制主題的整體處理。在此過程中,作者尋求開發一個基於模型的數據驅動控制框架,該框架將數據系統識別、基於模型的強化學習和最優控制以及每個主題的應用連接起來。這種評估經典結果的新技術將會是更有效的強化學習系統。本書的核心是提供一個端到端的框架——從設計到應用——一種更易於處理的基於模型的強化學習技術。

作者介紹
(伊朗)米拉德·法爾西//劉俊|責編:張燁|譯者:高藝//夏宇翔//陳鋒//劉攀成//鍾家華等

目錄
前言
1  非線性系統分析
  1.1  符號
  1.2  非線性動態系統
  1.3  Lyapunov穩定性分析
  1.4  離散時間動態系統的穩定性分析
  1.5  總結
  參考文獻
2  優化控制
  2.1  問題描述
  2.2  動態規劃
  2.3  線性二次型調節器
  2.4  總結
  參考文獻
3  強化學習
  3.1  具有二次成本的控制仿射系統
  3.2  精確策略迭代
  3.3  未知動力學和函數逼近的策略迭代
  3.4  總結
  參考文獻
4  動態模型的學習
  4.1  簡介
  4.2  模型選擇
  4.3  參數模型
  4.4  參數化學習演算法
  4.5  持續激勵
  4.6  Python工具箱
  4.7  對比結果
  4.8  總結
  參考文獻
5  基於結構化在線學習的連續時間非線性系統控制
  5.1  簡介
  5.2  結構化近似最優控制框架
  5.3  局部穩定性與最優性分析
  5.4  SOL演算法
  5.5  模擬結果
  5.6  小結
  參考文獻
6  結構化在線學習方法在未知動態非線性跟蹤中的應用
  6.1  簡介
  6.2  跟蹤控制的結構化在線學習
  6.3  使用SOL的基於學習的跟蹤控制
  6.4  模擬結果
  6.5  總結
  參考文獻
7  分段學習與控制及其穩定性保證
  7.1  簡介
  7.2  問題公式化描述
  7.3  分段學習與控制框架
  7.4  不確定性邊界分析

  7.5  分段仿射學習與控制的穩定性驗證
  7.6  數值結果
  7.7  總結
  參考文獻
8  太陽能光伏系統應用
  8.1  簡介
  8.2  問題描述
  8.3  光伏陣列的最優控制
  8.4  應用注意事項
  8.5  模擬結果
  8.6  總結
  參考文獻
9  四旋翼無人機低級控制應用
  9.1  簡介
  9.2  四旋翼無人機模型
  9.3  基於RLS識別器的四旋翼無人機結構化在線學習
  9.4  數值結果
  9.5  總結
  參考文獻
10  Python工具箱
  10.1  概述
  10.2  用戶輸入
  10.3  SOL
  10.4  顯示與輸出
  10.5  總結
  參考文獻
附錄
  A.1  註釋5.4的補充分析
  A.2  註釋5.5的補充分析

  • 商品搜索:
  • | 高級搜索
首頁新手上路客服中心關於我們聯絡我們Top↑
Copyrightc 1999~2008 美商天龍國際圖書股份有限公司 臺灣分公司. All rights reserved.
營業地址:臺北市中正區重慶南路一段103號1F 105號1F-2F
讀者服務部電話:02-2381-2033 02-2381-1863 時間:週一-週五 10:00-17:00
 服務信箱:bookuu@69book.com 客戶、意見信箱:cs@69book.com
ICP證:浙B2-20060032