幫助中心 | 我的帳號 | 關於我們

基於深度學習的視覺表達--方法與應用

  • 作者:龐善民|責編:郭鵬飛
  • 出版社:西安交大
  • ISBN:9787569335408
  • 出版日期:2024/12/01
  • 裝幀:平裝
  • 頁數:144
人民幣:RMB 79 元      售價:
放入購物車
加入收藏夾

內容大鋼
    本專著結合認知科學、信息科學與人工智慧學科的最新研究進展,介紹前沿的視覺語義表達技術。首先,通過對國內外研究者開展圖像表達問題的歷史進程和方法設計進行時間線和不同角度的梳理,引出圖像表達的系統架構以及它的發展現狀。其次,在現有研究方法的基礎上,圍繞著電腦視覺落地應用時遇到的一些實際問題,介紹可行的圖像表達解決方案,為圖像視頻數據的綜合利用或實際部署提供技術支撐。
    本書分為3個部分:第1部分介紹視覺表達問題中包含的技術鏈條和典型演算法;在後面兩個部分,分別將視覺表達技術應用到了分類和檢索任務中去。具體而言,第2部分以分類任務為對象,重點介紹了小樣本、長尾、零樣本識別等典型應用中的視覺表達方法設計原則與技巧。第3部分詳細介紹了檢索任務中的視覺表達學習方法,結合基於內容的圖像檢索、文本-圖像跨模態檢索,以及語音-圖像跨模態檢索等多個具體檢索任務給出構造具有較強區分能力的語義表達的解決方案。

作者介紹
龐善民|責編:郭鵬飛

目錄
  第0章  緒論
第1部分  視覺表達問題與典型方法
  第1章  基於傳統特徵的語義表達
    1.1  圖像特徵
      1.1.1  圖像全局特徵
      1.1.2  圖像局部特徵
    1.2  特徵編碼與聚合
      1.2.1  BoW
      1.2.2  SPM
      1.2.3  VLAD
    1.3  理解基於傳統特徵的圖像表達方法
  第2章  基於深度學習的語義表達
    2.1  卷積神經網路的相關知識
      2.1.1  全連接層
      2.1.2  卷積層
      2.1.3  池化層
      2.1.4  激活函數
    2.2  ImageNet
    2.3  典型深度學習模型
      2.3.1  AlexNet
      2.3.2  ResNet
    2.4  理解基於深度學習的圖像表達
第2部分  圖像分類中的語義表達應用
  第3章  一種基於元骨幹網路的小樣本圖像分類方法
    3.1  問題描述
    3.2  小樣本圖像分類問題定義
    3.3  元骨幹網路
      3.3.1  基於殘差網路的特徵提取器
      3.3.2  基於類原型的權重生成器
      3.3.3  基於自適應間隔的餘弦分類器
    3.4  元骨幹網路的訓練
      3.4.1  優化方法
      3.4.2  訓練流程
    3.5  實驗驗證
      3.5.1  數據集
      3.5.2  實驗設置
      3.5.3  實驗結果
    3.6  本章小結
  第4章  一種基於解耦訓練的長尾圖像分類方法
    4.1  問題描述
    4.2  基線模型
      4.2.1  基線模型架構
      4.2.2  基線模型訓練範式
    4.3  分層塊融合網路
      4.3.1  網路架構
      4.3.2  解耦訓練範式
      4.3.3  樣本數導向均衡損失
    4.4  實驗驗證
      4.4.1  數據集和評價指標
      4.4.2  方法選擇實驗

      4.4.3  超參數選擇實驗
      4.4.4  對比方法
      4.4.5  定量比較結果
      4.4.6  消融實驗
      4.4.7  可視化結果
    4.5  本章小結
  第5章  一種基於語義表達轉換的零樣本圖像分類方法
    5.1  問題描述
    5.2  生成式零樣本學習相關原理
      5.2.1  類別描述信息
      5.2.2  視覺與類別向量關聯方法
    5.3  語義表達轉換方法ART
      5.3.1  辨識性嵌入模塊Embedding
      5.3.2  語義關聯映射模塊Mapping
      5.3.3  ART演算法流程
    5.4  實驗驗證
      5.4.1  數據集
      5.4.2  實驗設置
      5.4.3  超參數選擇實驗
      5.4.4  消融實驗
      5.4.5  定量比較結果
      5.4.6  可視化結果
    5.5  本章小結
第3部分  圖像檢索中的語義表達
  第6章  一種基於熱擴散方程的圖像檢索方法
    6.1  問題描述
    6.2  基於熱擴散方程的圖像表達
      6.2.1  問題建模
      6.2.2  權重計算簡化
    6.3  基於熱擴散方程的檢索結果重排序
    6.4  實驗驗證
      6.4.1  效果評估方法
      6.4.2  數據集
      6.4.3  超參數選擇實驗
      6.4.4  定量比較結果
      6.4.5  計算開銷
    6.5  本章小結
  第7章  一種基於深度監督匹配的圖文跨模態檢索方法
    7.1  問題描述
    7.2  深度監督匹配的零樣本圖文檢索
      7.2.1  基於注意力的特徵學習模塊
      7.2.2  分類網路學習模塊
      7.2.3  跨模態特徵匹配學習模塊
    7.3  實驗驗證
      7.3.1  數據集與實驗設置
      7.3.2  定量比較結果
      7.3.3  消融實驗
      7.3.4  超參數敏感性分析
      7.3.5  定性分析
    7.4  本章小結

  第8章  一種音頻與圖像之間的跨模態檢索、定位與分類方法
    8.1  問題描述
    8.2  跨模態零樣本學習框架
      8.2.1  模型架構
      8.2.2  目標函數
    8.3  實驗準備
      8.3.1  數據集構建
      8.3.2  零樣本跨模態檢索
      8.3.3  零樣本聲源定位
      8.3.4  零樣本圖像分類
    8.4  結果與分析
      8.4.1  零樣本跨模態檢索
      8.4.2  零樣本聲源定位
      8.4.3  零樣本圖像分類
    8.5  本章小結
  第9章  總結與展望
    9.1  內容總結
    9.2  未來展望
參考文獻

  • 商品搜索:
  • | 高級搜索
首頁新手上路客服中心關於我們聯絡我們Top↑
Copyrightc 1999~2008 美商天龍國際圖書股份有限公司 臺灣分公司. All rights reserved.
營業地址:臺北市中正區重慶南路一段103號1F 105號1F-2F
讀者服務部電話:02-2381-2033 02-2381-1863 時間:週一-週五 10:00-17:00
 服務信箱:bookuu@69book.com 客戶、意見信箱:cs@69book.com
ICP證:浙B2-20060032