幫助中心 | 我的帳號 | 關於我們

無人系統智能感知與決策基礎/無人系統協同智能自主技術系列

  • 作者:閔令通//王秉路//呂勤毅//王大偉//譚震|責編:馮濤//吳超莉
  • 出版社:科學
  • ISBN:9787030803078
  • 出版日期:2026/03/01
  • 裝幀:平裝
  • 頁數:221
人民幣:RMB 118 元      售價:
放入購物車
加入收藏夾

內容大鋼
    本書分為6章。其中,第1章講述了機器學習中的數學基礎,包含線性代數和概率論等;第2章深入講述了機器學習、深度學習和強化學習的基礎知識;第3章講述了基於雷達的無人系統智能感知,包含連續多普勒雷達智能感知、脈衝多普勒雷達智能感知和多感測器融合智能感知;第4章講述了連續潛在變數、順序數據、組合模型等智能決策基礎;第5章講述了預測及博弈的基本原理,包含博弈與均衡、極小極大定理、零和博弈、未知博弈、博弈均衡等;第6章講述了策略搜索技術,包括策略梯度、策略梯度優化、策略驗證等。
    本書可作為普通高等學校電子信息類專業、自動化專業、電腦專業本科生「智能感知與決策」課程的教材,也可作為其他專業學生或相關行業工程技術人員的參考書。

作者介紹
閔令通//王秉路//呂勤毅//王大偉//譚震|責編:馮濤//吳超莉

目錄
第1章  機器學習中的數學基礎
  1.1  線性代數基礎
    1.1.1  基礎概念和符號
    1.1.2  矩陣加法
    1.1.3  矩陣乘法
    1.1.4  矩陣高級運算
    1.1.5  矩陣微積分
  1.2  概率論基礎
    1.2.1  基礎概念和符號
    1.2.2  隨機變數與概率函數
    1.2.3  期望與方差
    1.2.4  常見隨機變數
    1.2.5  兩個隨機變數
  小結
  參考文獻
第2章  機器學習的主要範式與方法
  2.1  監督學習以及偏差和過擬合的概念
    2.1.1  概率監督演算法
    2.1.2  支持向量機
  2.2  無監督學習
    2.2.1  主成分分析
    2.2.2  k-均值聚類
  2.3  深度學習方法
  2.4  RL模型框架
  2.5  學習策略的不同組成部分
  2.6  從數據中學習策略的不同設置
    2.6.1  離線和在線學習
    2.6.2  非策略性學習和策略性學習
  小結
  參考文獻
第3章  基於雷達的無人系統智能感知
  3.1  雷達感知概述
    3.1.1  雷達簡介
    3.1.2  雷達方程與定義
    3.1.3  無人系統中的雷達應用與系統設計
  3.2  基於連續多普勒雷達智能感知
    3.2.1  單頻連續波雷達模型
    3.2.2  應用
  3.3  基於脈衝多普勒雷達智能感知
    3.3.1  特徵及應用
    3.3.2  脈衝多普勒雜波
    3.3.3  動態範圍及穩定度要求
  小結
  參考文獻
第4章  無人系統智能決策方法基礎
  4.1  連續潛在變數
    4.1.1  主成分分析
    4.1.2  概率主成分分析
    4.1.3  核主成分分析
    4.1.4  非線性潛在變數模型

  4.2  順序數據
    4.2.1  馬爾可夫模型
    4.2.2  隱馬爾可夫模型
  4.3  組合模型
    4.3.1  貝葉斯平均模型
    4.3.2  模型集成
    4.3.3  提升方法
    4.3.4  基於樹的模型
    4.3.5  條件混合模型
  小結
  參考文獻
第5章  預測及博弈
  5.1  博弈及均衡
    5.1.1  K人範式博弈
    5.1.2  納什均衡
    5.1.3  兩人零和博弈
    5.1.4  相關均衡
    5.1.5  重複博弈
    5.1.6  虛擬博弈
  5.2  極小極大定理
  5.3  重複的兩人零和博弈
  5.4  相關均衡與內回歸
  5.5  未知博弈:博弈論
  5.6  校準和相關均衡
  5.7  布萊克威爾逼近性定理
  5.8  基於潛力的可接近性
  5.9  納什均衡的收斂性
  5.10  未知博弈的收斂
  5.11  對抗做出反應的對手
  小結
  參考文獻
第6章  策略搜索與驗證
  6.1  策略搜索
    6.1.1  近似策略評估
    6.1.2  局部搜索
    6.1.3  遺傳演算法
    6.1.4  交叉熵法
    6.1.5  進化策略
    6.1.6  各向同性進化策略
  6.2  策略梯度估計
    6.2.1  有限差分
    6.2.2  回歸梯度
    6.2.3  似然比
    6.2.4  行動獎勵
    6.2.5  基線減法
  6.3  策略梯度優化
    6.3.1  梯度上升更新
    6.3.2  受限梯度更新
    6.3.3  自然梯度更新
    6.3.4  信賴域更新

    6.3.5  固定替代目標
  6.4  行為-批評方法
    6.4.1  行為-批評方法的原理
    6.4.2  廣義優勢估計
    6.4.3  確定性策略梯度
    6.4.4  蒙特卡洛樹搜索的行為-批評方法
  6.5  策略驗證
    6.5.1  性能指標評估
    6.5.2  罕見事件模擬
    6.5.3  魯棒性分析
    6.5.4  交易分析
    6.5.5  對抗性分析
  小結
參考文獻

  • 商品搜索:
  • | 高級搜索
首頁新手上路客服中心關於我們聯絡我們Top↑
Copyrightc 1999~2008 美商天龍國際圖書股份有限公司 臺灣分公司. All rights reserved.
營業地址:臺北市中正區重慶南路一段103號1F 105號1F-2F
讀者服務部電話:02-2381-2033 02-2381-1863 時間:週一-週五 10:00-17:00
 服務信箱:bookuu@69book.com 客戶、意見信箱:cs@69book.com
ICP證:浙B2-20060032