幫助中心 | 我的帳號 | 關於我們

隨機動態決策理論與應用/運籌與管理科學叢書

  • 作者:胡奇英|責編:張瑋
  • 出版社:西安電子科大
  • ISBN:9787560667492
  • 出版日期:2023/07/01
  • 裝幀:平裝
  • 頁數:272
人民幣:RMB 47 元      售價:
放入購物車
加入收藏夾

內容大鋼
    本書介紹隨機動態決策的理論與應用。全書共14章,分為理論篇和應用篇。第1章?第6章為理論篇,內容包括離散時間馬爾可夫決策過程(有限階段、無限階段折扣準則、無限階段平均準則),半馬爾可夫決策過程,連續時間馬爾可夫決策過程,強化學習與近似演算法;第7章?第14章為應用篇,內容包括庫存管理,收益管理,網上拍賣,網上拍賣下的收益管理、庫存管理,技術的採用與選擇,排隊(服務)系統的最優控制,組合證券選擇與風險管理,供應鏈動態管理。
    本書適合作為高等院校管理科學、運籌學、自動控制、電腦科學等專業的研究生教材,也可供對動態決策理論、人工智慧諸方面感興趣的研究人員閱讀。

作者介紹
胡奇英|責編:張瑋

目錄
理論篇
  第1章  有限階段
    1.1  單階段決策
    1.2  多階段動態決策:確定性
    1.3  多階段馬爾可夫決策過程
      1.3.1  模型
      1.3.2  最優方程與最優策略
    1.4  若干隨機動態決策問題
      1.4.1  期權的購買與執行問題
      1.4.2  最優選擇問題
      1.4.3  產品定價問題
    1.5  模函數與單調策略
      1.5.1  最優策略的單調性
      1.5.2  受罰款限制的最優分配問題
    習題
    參考文獻
  第2章  離散時間馬爾可夫決策過程:折扣準則
    2.1  模型與折扣最優方程
      2.1.1  模型
      2.1.2  最優方程
    2.2  演算法
      2.2.1  逐次逼近法(值迭代法)
      2.2.2  策略迭代法
      2.2.3  線性規劃法
    2.3  應用
      2.3.1  最優停止問題
      2.3.2  項目管理:Bandit問題
    2.4  MDP模型的推廣
      2.4.1  一種無界報酬條件
      2.4.2  非可數決策集
      2.4.3  一般策略集
    2.5  期望總報酬準則
      2.5.1  模型縮減
      2.5.2  報酬函數的有限性
      2.5.3  最優值函數的有限性及最優方程
    習題
    參考文獻
  第3章  離散時間馬爾可夫決策過程:平均準則
    3.1  平均準則的最優方程
      3.1.1  平均準則的最優方程與最優策略
      3.1.2  常返性條件
      3.1.3  有限MDP
    3.2  演算法
      3.2.1  逐次逼近法
      3.2.2  策略迭代法
      3.2.3  線性規劃法
    3.3  最優不等式
    本章附錄:若干引理
    習題
    參考文獻

  第4章  半馬爾可夫決策過程
    4.1  半馬爾可夫決策過程模型
      4.1.1  SMDP模型
      4.1.2  正則性條件
      4.1.3  準則函數
    4.2  轉換為離散時間馬爾可夫決策過程
      4.2.1  期望折扣總報酬準則
      4.2.2  平均準則
    4.3  馬爾可夫型SMDP
    4.4  模型推廣:報酬函數的一般形式
    習題
    參考文獻
  第5章  連續時間馬爾可夫決策過程
    5.1  時齊模型
    5.2  期望折扣總報酬準則
      5.2.1  折扣準則
      5.2.2  期望折扣總報酬準則
    5.3  平均準則
    5.4  非時齊模型
    習題
    參考文獻
  第6章  強化學習與近似演算法
    6.1  強化學習:折扣準則
      6.1.1  折扣目標函數值的估計
      6.1.2  強化學習演算法
      6.1.3  TD(λ)
    6.2  強化學習:平均準則
      6.2.1  平均準則函數值的估計
      6.2.2  平均準則的強化學習演算法
    6.3  近似演算法
      6.3.1  近似逐次逼近法
      6.3.2  近似策略迭代法
    習題
    參考文獻
應用篇
  第7章  庫存管理
    7.1  多周期隨機庫存管理問題
      7.1.1  多周期庫存管理問題
      7.1.2  有限階段期望折扣總費用
      7.1.3  短視策略
    7.2  無限階段隨機存貯問題
      7.2.1  無限階段折扣準則
      7.2.2  無限階段平均準則
      7.2.3  損失制
    7.3  存貯與定價的聯合動態決策
      7.3.1  有限階段
      7.3.2  無限階段
    習題
    參考文獻
  第8章  收益管理

    8.1  價格固定時的容量分配
      8.1.1  靜態模型
      8.1.2  動態模型
      8.1.3  預訂和超訂
    8.2  價格動態變化時的多階段容量分配
    8.3  連續時間動態定價
    8.4  基於Priceline的買方/賣方定價收益
      管理問題
      8.4.1  買方定價
      8.4.2  賣方定價
    8.5  房地產市場的政府調控策略:基於收益管理
    8.6  收益管理的進一步討論
    習題
    參考文獻
  第9章  網上拍賣
    9.1  拍賣簡介
    9.2  單物品網上拍賣中的顧客投標策略
      9.2.1  問題與模型
      9.2.2  IPV下硬性結束規則的一級價格網上拍賣
      9.2.3  IPV下軟性結束規則的一級價格網上拍賣
      9.2.4  其他類型的網上拍賣
    9.3  單階段多物品網上拍賣的收益
    習題
    參考文獻
  第10章  網上拍賣下的收益管理、庫存管理
    10.1  網上分批拍賣下的收益管理
      10.1.1  問題與模型
      10.1.2  最優分配策略的單調性
      10.1.3  數值分析
    10.2  網上拍賣下的庫存管理
      10.2.1  有限階段
      10.2.2  折扣準則
      10.2.3  平均準則
      10.2.4  最優保留價
      10.2.5  數值分析
    習題
    參考文獻
  第11章  技術的採用與選擇
    11.1  最優更換
      11.1.1  有限階段
      11.1.2  無限階段折扣準則
      11.1.3  平均準則
    11.2  技術採用
    11.3  基於購買的技術更新問題
    11.4  基於自行研發的技術更新問題
    11.5  新產品策略與庫存管理
    習題
    參考文獻
  第12章  排隊(服務)系統的最優控制
    12.1  排隊系統的到達控制

      12.1.1  M/G/1排隊系統的靜態到達率控制
      12.1.2  M/M/K排隊系統的動態到達率控制
      12.1.3  一般動態到達控制
    12.2  排隊系統服務控制
      12.2.1  M/M/1:隊長模型
      12.2.2  M/PH/1:隊長與工作量混合模型
    12.3  排隊網路控制
      12.3.1  到達控制
      12.3.2  服務控制
      12.3.3  路徑控制
    習題
    參考文獻
  第13章  組合證券選擇與風險管理
    13.1  動態資產定價
    13.2  多階段組合證券的期望一方差分析
    13.3  多階段風險管理:條件風險值CVaR
      13.3.1  問題與模型
      13.3.2  最小CVaR和最優策略
      13.3.3  應用:組合證券優化
    習題
    參考文獻
  第14章  供應鏈動態管理
    14.1  易腐產品的供應鏈多周期管理
    14.2  連續時間收益供應鏈管理
      14.2.1  集中決策
      14.2.2  分散決策
    習題
    參考文獻
後記

  • 商品搜索:
  • | 高級搜索
首頁新手上路客服中心關於我們聯絡我們Top↑
Copyrightc 1999~2008 美商天龍國際圖書股份有限公司 臺灣分公司. All rights reserved.
營業地址:臺北市中正區重慶南路一段103號1F 105號1F-2F
讀者服務部電話:02-2381-2033 02-2381-1863 時間:週一-週五 10:00-17:00
 服務信箱:bookuu@69book.com 客戶、意見信箱:cs@69book.com
ICP證:浙B2-20060032