幫助中心 | 我的帳號 | 關於我們

多智能體強化學習(基礎與現代方法)/智能系統與技術叢書

  • 作者:(德)斯特凡諾·V.阿爾布萊希特//(希)菲利波斯·克里斯蒂安諾斯//(德)盧卡斯·舍費爾|責編:劉鋒//馮潤峰|譯者:孫羅洋//李欣然//張海峰
  • 出版社:機械工業
  • ISBN:9787111776871
  • 出版日期:2025/04/01
  • 裝幀:平裝
  • 頁數:241
人民幣:RMB 109 元      售價:
放入購物車
加入收藏夾

內容大鋼
    多智能體強化學習(Multi-Agent Reinforcement Learning,MARL)是機器學習中的一個領域,研究多個智能體如何在共享環境中學習最優的交互方式。這一領域在現代生活中有著廣泛的應用,包括自動駕駛、多機器人工廠、自動化交易和能源網路管理等。
    本書是一部系統闡述多智能體強化學習理論與技術的權威著作,清晰而嚴謹地介紹了MARL的模型、解決方案概念、演算法思想、技術挑戰以及現代方法。書中首先介紹了該領域的基礎知識,包括強化學習理論和演算法的基礎、互動式博弈模型、博弈中的不同解決方案概念以及支撐MARL研究的演算法思想。隨後,書中詳細介紹了利用深度學習技術的現代MARL演算法,涵蓋集中訓練與分散執行、價值分解、參數共享和自博弈等思想。本書還附帶了一個用Python編寫的MARL代碼庫,其中包括自包含且易於閱讀的MARL演算法實現。
    本書技術內容以易於理解的語言解釋,並通過大量示例進行說明,既為初學者闡明了MARL的概念,也為專業的讀者提供了高層次的見解。

作者介紹
(德)斯特凡諾·V.阿爾布萊希特//(希)菲利波斯·克里斯蒂安諾斯//(德)盧卡斯·舍費爾|責編:劉鋒//馮潤峰|譯者:孫羅洋//李欣然//張海峰

目錄
譯者序
前言
符號總覽
  第1章  引言
    1.1  多智能體系統
    1.2  多智能體強化學習
    1.3  應用示例
      1.3.1  多機器人倉庫管理
      1.3.2  棋盤遊戲和電子遊戲中的競爭性對戰
      1.3.3  自動駕駛
      1.3.4  電子市場中的自動化交易
    1.4  多智能體強化學習的挑戰
    1.5  多智能體強化學習的議題
    1.6  本書內容和結構
第一部分  多智能體強化學習的基礎
  第2章  強化學習
    2.1  一般定義
    2.2  馬爾可夫決策過程
    2.3  期望折扣回報和最優策略
    2.4  價值函數與貝爾曼方程
    2.5  動態規劃
    2.6  時序差分學習
    2.7  學習曲線評估
    2.8  R(s,a,s')和R(s,a)的等價性
    2.9  總結
  第3章  博弈:多智能體交互模型
    3.1  標準式博弈
    3.2  重複標準式博弈
    3.3  隨機博弈
    3.4  部分可觀測隨機博弈
    3.5  建模通信
    3.6  博弈中的知識假設
    3.7  詞典:強化學習與博弈論
    3.8  總結
  第4章  博弈的解概念
    4.1  聯合策略與期望回報
    4.2  最佳響應
    4.3  極小極大演算法
    4.4  納什均衡
    4.5  ε-納什均衡
    4.6  (粗)相關均衡
    4.7  均衡解的概念局限性
    4.8  帕雷托最優
    4.9  社會福利和公平
  ……
第二部分  多智能體深度強化學習:演算法與實踐
多智能體強化學習研究綜述
參考文獻

  • 商品搜索:
  • | 高級搜索
首頁新手上路客服中心關於我們聯絡我們Top↑
Copyrightc 1999~2008 美商天龍國際圖書股份有限公司 臺灣分公司. All rights reserved.
營業地址:臺北市中正區重慶南路一段103號1F 105號1F-2F
讀者服務部電話:02-2381-2033 02-2381-1863 時間:週一-週五 10:00-17:00
 服務信箱:bookuu@69book.com 客戶、意見信箱:cs@69book.com
ICP證:浙B2-20060032