幫助中心 | 我的帳號 | 關於我們

強化學習及其在自動駕駛汽車中的應用/智能網聯汽車機器學習系列

  • 作者:編者:裴曉飛|責編:王興宇//鞏高鑠
  • 出版社:機械工業
  • ISBN:9787111809524
  • 出版日期:2026/06/01
  • 裝幀:平裝
  • 頁數:182
人民幣:RMB 119 元      售價:
放入購物車
加入收藏夾

內容大鋼
    傳統的基於模型規則的自動駕駛決策演算法面對自動駕駛汽車的長尾效應顯得力不從心,亟待採用人工智慧新方法突破當前智慧程度不足的瓶頸。為此,本書從強化學習演算法應用的層面,總結了其在自動駕駛決策規劃方面的典型案例。首先,全面闡述了自動駕駛汽車軟體工程的特點,包括架構、場景和測試,其次,系統總結了強化學習的理論基礎,包括主要分類、典型演算法及其衍生髮展。從第4章開始,本書結合實踐案例全面介紹了強化學習演算法在不同場景自動駕駛任務中的應用,依次包括離線學習+在線學習、狀態表徵+強化學習、風險敏感的強化學習、強化學習+軌跡規劃、強化學習+模仿學習、意圖識別+強化學習和多智能體強化學習,力圖通過對上述方法的具體闡述和結果分析為感興趣的讀者提供一定的技術參考和思維啟發。本書適合智能網聯汽車從業者,包括開發者、設計者、科研工作者以及剛入門的人員閱讀參考。

作者介紹
編者:裴曉飛|責編:王興宇//鞏高鑠

目錄
前言
第1章  概述
  1.1  自動駕駛汽車概述
  1.2  機器學習概述
  1.3  強化學習應用概述
第2章  自動駕駛汽車軟體技術
  2.1  自動駕駛汽車的分層式架構
    2.1.1  環境感知及其衍生
    2.1.2  決策規劃及其前提
    2.1.3  運動控制及其冗余
  2.2  學習型的決策與規劃
    2.2.1  行為規劃與局部規劃的關係
    2.2.2  模仿學習概述
  2.3  自動駕駛汽車的端到端架構
  2.4  場景驅動的自動駕駛
    2.4.1  典型場景
    2.4.2  場景指標
    2.4.3  場景數據
  2.5  自動駕駛汽車的軟體測試
    2.5.1  模擬測試
    2.5.2  數字孿生
    2.5.3  實車測試
第3章  強化學習的理論基礎
  3.1  強化學習的基本概念
    3.1.1  馬爾可夫決策過程
    3.1.2  部分可觀馬爾可夫決策過程
    3.1.3  有約束馬爾可夫決策過程
  3.2  強化學習的方法分類
    3.2.1  根據是否基於模型分類
    3.2.2  根據求解方式的分類
    3.2.3  根據學習的實時性分類
    3.2.4  根據動作空間的分類
    3.2.5  根據智能體的數量分類
  3.3  典型強化學習演算法介紹
    3.3.1  DDQN
    3.3.2  TD
    3.3.3  DSAC
    3.3.4  Rainbow DQN
  3.4  強化學習的任務與設計
    3.4.1  場景任務
    3.4.2  設計範式
  3.5  強化學習的發展與挑戰
    3.5.1  安全性
    3.5.2  數據利用的效率性
    3.5.3  泛化性
第4章  結合蒙特卡洛樹搜索的決策模型
  4.1  基於DRQN的超車決策模型
    4.1.1  DRQN演算法
    4.1.2  超車問題MDP建模
  4.2  在線安全決策模塊

    4.2.1  蒙特卡洛樹搜索演算法
    4.2.2  安全強化學習
  4.3  場景搭建及模擬結果
    4.3.1  模擬場景搭建
    4.3.2  模擬參數設置
    4.3.3  實驗結果分析
第5章  基於狀態表徵的決策模型
  5.1  問題描述
    5.1.1  維度問題
    5.1.2  排序問題
  5.2  狀態表徵網路
  5.3  狀態表徵下的決策模型
    5.3.1  演算法總體框架
    5.3.2  多車道問題MDP建模
    5.3.3  安全規則設計
  5.4  場景搭建及模擬結果
    5.4.1  模擬場景搭建
    5.4.2  模擬參數設置
    5.4.3  實驗結果分析
第6章  考慮風險敏感的決策模型
  6.1  風險敏感演算法設計
    6.1.1  Rainbow DQN-QR演算法
    6.1.2  Rainbow DQN-CVaR演算法
  6.2  決策模型的建立
    6.2.1  演算法總體框架
    6.2.2  MDP建模
    6.2.3  規控模塊設計
  6.3  場景搭建和模擬結果
    6.3.1  模擬場景搭建
    6.3.2  模擬參數設置
    6.3.3  實驗結果分析
第7章  具有混合動作空間的決策模型
  7.1  混合型決策規劃設計
    7.1.1  演算法總體框架
    7.1.2  MDP建模
    7.1.3  規控模塊設計
  7.2  場景搭建和模擬結果
    7.2.1  模擬場景搭建
    7.2.2  模擬參數設置
    7.2.3  實驗結果分析
第8章  結合模仿學習的決策模型
  8.1  基於GRSD-DDQN的決策模型
    8.1.1  DDQN演算法的優化
    8.1.2  匯流問題MDP建模
    8.1.3  規控模塊設計
  8.2  基於行為克隆的決策模型
    8.2.1  專家數據獲取
    8.2.2  駕駛行為克隆模型
  8.3  結合模仿學習與強化學習的決策模型
    8.3.1  演算法總體框架

    8.3.2  DQfD演算法
    8.3.3  模型預訓練
  8.4  場景搭建與模擬結果
    8.4.1  模擬場景搭建
    8.4.2  實驗結果分析
第9章  基於駕駛意圖的決策模型
  9.1  駕駛意圖推理模型
  9.2  考慮駕駛意圖的並道決策
    9.2.1  並道問題MDP建模
    9.2.2  規則引導策略
  9.3  場景搭建及模擬結果
    9.3.1  模擬場景搭建
    9.3.2  模擬參數設置
    9.3.3  實驗結果分析
第10章  多車編隊協同決策模型
  10.1  多智能體強化學習
    10.1.1  理論基礎
    10.1.2  VDN演算法
    10.1.3  QMIX演算法
    10.1.4  通信網路
    10.1.5  One-Hot編碼
  10.2  編隊模型建立
  10.3  模擬場景與結果分析
    10.3.1  模擬場景搭建
    10.3.2  車輛隊列初始化
    10.3.3  模擬參數設置
    10.3.4  實驗結果分析
參考文獻

  • 商品搜索:
  • | 高級搜索
首頁新手上路客服中心關於我們聯絡我們Top↑
Copyrightc 1999~2008 美商天龍國際圖書股份有限公司 臺灣分公司. All rights reserved.
營業地址:臺北市中正區重慶南路一段103號1F 105號1F-2F
讀者服務部電話:02-2381-2033 02-2381-1863 時間:週一-週五 10:00-17:00
 服務信箱:bookuu@69book.com 客戶、意見信箱:cs@69book.com
ICP證:浙B2-20060032