幫助中心 | 我的帳號 | 關於我們

電腦視覺十講/十講系列/電腦科學前沿叢書

  • 作者:編者:查紅彬|責編:梁偉//韓飛
  • 出版社:機械工業
  • ISBN:9787111756866
  • 出版日期:2025/01/01
  • 裝幀:平裝
  • 頁數:517
人民幣:RMB 99 元      售價:
放入購物車
加入收藏夾

內容大鋼
    電腦視覺是人工智慧的重要分支,其研究是電腦系統智能化的第一步,也是實現人工智慧的橋樑。本書面向電腦視覺,聚焦前沿演算法理論,分別講述了圖像分類、檢測、生成、視頻處理等電腦視覺領域的研究重點,也對電腦視覺的基本概念和電腦視覺研究的預備知識進行了簡要介紹,幫助讀者在構建完整的電腦視覺知識框架的同時,打下較為堅實的基礎,為進一步在電腦視覺和相關領域提出新設想、開發新演算法、解決新問題創造良好的條件。本書可作為人工智慧專業和電腦類相關專業的低年級研究生學習電腦視覺的參考書,也可作為從事電腦視覺技術研究工作的科研人員的自學用書。

作者介紹
編者:查紅彬|責編:梁偉//韓飛
    查紅彬,北京大學智能學院博雅特聘教授,機器感知與智能教育部重點實驗室主任。主要從事電腦視覺與智能機器人感知的研究,在三維視覺幾何計算、三維重建與環境幾何建模、感測器即時定位與地圖構建等方面取得一系列成果,發表學術期刊及國際會議論文350多篇。現任中國電腦學會出版工作委員會主任、中國圖象圖形學學會監事長,曾任中國電腦學會電腦視覺專委會主任。獲得CCF-CV傑出成就獎等學術獎項。

目錄
叢書序
「十講」序
推薦序
前言
第1講  底層視覺
  1.1  底層視覺概述
    1.1.1  底層視覺定義
    1.1.2  傳統底層視覺方法
  1.2  基於數學模型的底層視覺方法
    1.2.1  全變分模型
    1.2.2  稀疏和低秩模型
    1.2.3  小結
  1.3  基於深度學習的底層視覺方法
    1.3.1  圖像去噪
    1.3.2  圖像超解析度
    1.3.3  基於VGG模型的圖像超解析度方法
    1.3.4  圖像去模糊
  1.4  底層視覺的挑戰與展望
  參考文獻
第2講  圖像質量評價
  2.1  全參考/部分參考型圖像質量評價
    2.1.1  全參考型圖像質量評價
    2.1.2  部分參考型圖像質量評價
  2.2  無參考型圖像質量評價
    2.2.1  基於統計學的無參考型圖像質量評價
    2.2.2  基於深度學習的無參考型圖像質量評價
  2.3  圖像美學質量評價
    2.3.1  大眾化圖像美學評價
    2.3.2  個性化圖像美學評價
  2.4  總結與展望
  參考文獻
第3講  圖像分割
  3.1  圖像分割概述
    3.1.1  早期圖像分割
    3.1.2  語義分割
    3.1.3  實例分割和全景分割
    3.1.4  其他分割問題
  3.2  圖像語義分割
    3.2.1  背景與問題
    3.2.2  基於傳統特徵的圖像語義分割
    3.2.3  基於深度特徵的圖像語義分割
  3.3  圖像實例分割
    3.3.1  問題定義
    3.3.2  兩階段實例分割
    3.3.3  一階段實例分割
    3.3.4  基於Transformer的實例分割
  3.4  圖像全景分割
    3.4.1  問題定義
    3.4.2  子任務分離的全景分割
    3.4.3  子任務統一的全景分割

  3.5  弱監督圖像分割
    3.5.1  基於超像素的方法
    3.5.2  基於分類網路的方法
  3.6  跨域圖像分割
    3.6.1  基於風格遷移的輸入級圖像對齊
    3.6.2  基於域不變特徵發掘的中間級特徵對齊
    3.6.3  基於標籤分佈發掘的輸出級預測結果對齊
  3.7  醫療圖像分割
    3.7.1  全監督醫療圖像分割
    3.7.2  弱監督醫療圖像分割
  參考文獻
第4講  目標檢測
  4.1  目標檢測概述
    4.1.1  目標檢測的概念
    4.1.2  目標檢測的研究意義
    4.1.3  目標檢測的發展路線
    4.1.4  小結
  4.2  非深度學習目標檢測方法
    4.2.1  圖像匹配方法
    4.2.2  機器學習方法
    4.2.3  小結
  4.3  深度學習目標檢測方法
    4.3.1  深度學習簡介
    4.3.2  深度學習模型
    4.3.3  基於深度學習的方法框架
  4.4  評價指標和數據集
    4.4.1  數據集
    4.4.2  評價指標
  4.5  討論與展望
    4.5.1  目標檢測面臨的挑戰
    4.5.2  目標檢測的發展趨勢
  參考文獻
第5講  目標跟蹤
  5.1  引言
  5.2  目標跟蹤概述
    5.2.1  目標跟蹤的基本概念
    5.2.2  目標跟蹤的分類方式
    5.2.3  目標跟蹤的研究意義
    5.2.4  小結
  5.3  單目標跟蹤
    5.3.1  傳統方法
    5.3.2  深度學習方法
    5.3.3  數據集與評價指標
    5.3.4  小結
  5.4  多目標跟蹤
    5.4.1  多目標關聯技術
    5.4.2  一體化多目標跟蹤技術
    5.4.3  數據集與評價指標
    5.4.4  小結
  5.5  其他跟蹤問題

    5.5.1  視頻目標檢測與多目標跟蹤
    5.5.2  視頻實例分割中的跟蹤問題
    5.5.3  半監督視頻物體分割
    5.5.4  小結
  5.6  應用
    5.6.1  目標跟蹤與安防監控
    5.6.2  目標跟蹤與智能機器人
    5.6.3  目標跟蹤與自動駕駛
    5.6.4  無人機精準跟蹤
    5.6.5  跟蹤輔助視頻標注
  5.7  總結與展望
    5.7.1  目標跟蹤面臨的挑戰
    5.7.2  目標跟蹤的發展趨勢
    5.7.3  小結
  參考文獻
第6講  行人重識別
  6.1  行人重識別的定義與常用方法
    6.1.1  背景與問題
    6.1.2  常用方法
  6.2  行人重識別中的小樣本問題
    6.2.1  弱監督建模
    6.2.2  無監督建模
    6.2.3  遷移學習建模
  6.3  行人重識別中的開放性建模問題
    6.3.1  遮擋問題
    6.3.2  跨模態問題
    6.3.3  換裝問題
    6.3.4  其他問題
  參考文獻
第7講  視頻行為識別
  7.1  引言
  7.2  視頻行為識別數據集
    7.2.1  通用行為識別數據集
    7.2.2  骨架行為識別數據集
    7.2.3  群體行為識別數據集
    7.2.4  時域行為定位數據集
    7.2.5  時空行為定位數據集
    7.2.6  音視頻行為定位數據集
  7.3  視頻行為分類
    7.3.1  基於手工特徵的視頻行為分類方法概述
    7.3.2  基於深度學習的視頻行為分類方法概述
    7.3.3  常用方法
  7.4  行為定位
    7.4.1  時域行為定位
    7.4.2  時空行為定位
  7.5  骨架行為識別
    7.5.1  早期骨架行為識別方法
    7.5.2  基於深度學習的骨架行為識別
    7.5.3  總結與展望
  7.6  多模態行為識別

    7.6.1  基於文本的視頻定位
    7.6.2  音視頻行為識別
  7.7  交互及組群行為識別
    7.7.1  交互行為識別
    7.7.2  組群行為識別
    7.7.3  群體行為識別的未來研究趨勢
  參考文獻
第8講  視覺與語言
  8.1  視覺與語言的定義
    8.1.1  背景與意義
    8.1.2  典型任務與方法
  8.2  視覺語言的典型框架
    8.2.1  傳統方法
    8.2.2  預訓練方法
    8.2.3  其他方面
  8.3  視覺語言的語義關聯與建模
    8.3.1  注意力機制建模
    8.3.2  圖結構建模
    8.3.3  生成式建模
    8.3.4  其他建模
  8.4  視覺語言的預訓練技術
    8.4.1  單模態主幹網路
    8.4.2  視覺與語言架構
    8.4.3  預訓練任務與下游任務
    8.4.4  預訓練數據集
  8.5  視覺語言發展趨勢與展望
  參考文獻
第9講  圖像的三維重建
  9.1  背景介紹
  9.2  傳統三維重建方法回顧
    9.2.1  經典多視點幾何三維重建
    9.2.2  經典光度立體三維重建
    9.2.3  常見數據採集設備
  9.3  深度學習對基於不同形狀表達的三維重建
    9.3.1  基於體素的顯式三維表達
    9.3.2  基於多邊形網格的顯式三維表達
    9.3.3  基於隱式輻射場的三維表達
  9.4  三維重建與三維生成
    9.4.1  基於擴散生成大模型分數蒸餾的三維生成
    9.4.2  基於預訓練三維重建模型和擴散生成模型的三維生成
  參考文獻
第10講  SLAM
  10.1  基礎知識
    10.1.1  相機模型
    10.1.2  多視圖幾何原理
  10.2  SLAM的分類
    10.2.1  基於濾波的SLAM
    10.2.2  基於優化的SLAM
    10.2.3  基於深度學習的SLAM
  10.3  視覺SLAM

    10.3.1  初始化
    10.3.2  前台實時跟蹤
    10.3.3  後端優化
    10.3.4  重定位
    10.3.5  迴路閉合
  10.4  視覺慣性SLAM
    10.4.1  IMU模型
    10.4.2  前端模塊
    10.4.3  後端模塊
  10.5  融合深度信息的SLAM
    10.5.1  RGB-D SLAM
    10.5.2  激光視覺慣性SLAM
  10.6  SLAM發展趨勢與展望
參考文獻

  • 商品搜索:
  • | 高級搜索
首頁新手上路客服中心關於我們聯絡我們Top↑
Copyrightc 1999~2008 美商天龍國際圖書股份有限公司 臺灣分公司. All rights reserved.
營業地址:臺北市中正區重慶南路一段103號1F 105號1F-2F
讀者服務部電話:02-2381-2033 02-2381-1863 時間:週一-週五 10:00-17:00
 服務信箱:bookuu@69book.com 客戶、意見信箱:cs@69book.com
ICP證:浙B2-20060032