幫助中心 | 我的帳號 | 關於我們

深度強化學習演算法及其在智能決策中的應用研究

  • 作者:馬聰//孫若斌|責編:賀靜//楊元麗
  • 出版社:中國經濟
  • ISBN:9787513677738
  • 出版日期:2024/05/01
  • 裝幀:平裝
  • 頁數:179
人民幣:RMB 78 元      售價:
放入購物車
加入收藏夾

內容大鋼
    隨著人工智慧時代的到來,特別是AlphaGo、ChatGPT等突破性技術的問世,深度強化學習演算法已展現出其獨特的優勢,並在處理複雜決策問題方面發揮出巨大潛力。深度強化學習演算法將深度學習的感知能力與強化學習的決策能力相結合,實現了端到端的學習,是一種更加接近於人類思維方式的人工智慧演算法。然而,目前對深度強化學習演算法的研究仍處於初步發展階段,面臨諸多挑戰,包括樣本利用效率低、「探索和利用」難以平衡及獎勵函數設計困難等問題。本書系統闡述了深度強化學習演算法的理論和原理,針對其在量化金融、工業運維等應用領域所面臨的研究難點,展開相關研究,並創新性地提出相應的改進演算法,以推動深度強化學習演算法在智能決策領域的進一步發展。

作者介紹
馬聰//孫若斌|責編:賀靜//楊元麗

目錄
1  緒論
  1.1  研究背景與研究意義
  1.2  國內外研究現狀綜述
  1.3  研究內容及創新
  1.4  本書的組織結構
2  深度強化學習演算法概述
  2.1  強化學習演算法的原理
  2.2  最優價值演算法
  2.3  基於策略梯度的演算法
  2.4  小結
3  基於信息瓶頸理解正則化演算法的工作原理
  3.1  引言
  3.2  相關工作
  3.3  正則項的工作原理
  3.4  實驗
  3.5  小結
4  多模塊並行的單資產交易深度強化學習演算法
  4.1  引言
  4.2  用於單資產交易的PMMRL演算法
  4.3  實驗
  4.4  小結
5  趨勢一致的多智能體投資組合強化學習演算法
  5.1  引言
  5.2  用於投資組合管理的深度強化學習演算法
  5.3  趨勢一致正則項
  5.4  實驗
  5.5  風險管理
  5.6  小結
6  針對複雜多步驟任務的多環境並行的深度強化學習演算法
  6.1  引言
  6.2  多環境並行的獎勵塑形演算法
  6.3  數值實驗
  6.4  小結
7  深度強化學習在工業智能運維中的應用
  7.1  引言
  7.2  深度強化學習在智能運維中的優勢
  7.3  強化學習演算法在各工業領域中的應用
  7.4  小結
8  總結與展望
  8.1  總結
  8.2  展望
參考文獻
與本書相關的研究成果
附錄 A  技術指標
附錄 B  評價指標
索引
後記

  • 商品搜索:
  • | 高級搜索
首頁新手上路客服中心關於我們聯絡我們Top↑
Copyrightc 1999~2008 美商天龍國際圖書股份有限公司 臺灣分公司. All rights reserved.
營業地址:臺北市中正區重慶南路一段103號1F 105號1F-2F
讀者服務部電話:02-2381-2033 02-2381-1863 時間:週一-週五 10:00-17:00
 服務信箱:bookuu@69book.com 客戶、意見信箱:cs@69book.com
ICP證:浙B2-20060032