幫助中心 | 我的帳號 | 關於我們

電腦視覺與PyTorch項目實戰(基於深度學習框架的端到端產品級模型設計與開發)

  • 作者:(印)阿克謝·庫爾卡尼//阿達沙·希瓦南達//尼廷·奈傑·夏爾馬|責編:文開琪|譯者:歐拉
  • 出版社:清華大學
  • ISBN:9787302657422
  • 出版日期:2024/04/01
  • 裝幀:平裝
  • 頁數:221
人民幣:RMB 99 元      售價:
放入購物車
加入收藏夾

內容大鋼
    本書使用PyTorch框架來討論電腦視覺演算法及其應用。首先介紹電腦視覺基礎,主題涉及卷積神經網路、ResNet、YOLO、數據增強和業內使用的其他常規技術。隨後簡要概述PyTorch庫。接下來探究圖像分類問題、對象檢測技術以及如何在訓練和運行推理的同時實現遷移學習。最後通過一個完整的建模過程來闡述深度學習框架PyTorch是如何運用優化技巧和模型AI可解釋性的。
    本書適合具有一定基礎的中高級讀者閱讀和參考,可以幫助他們使用遷移學習和PyTorch來搭建產品級的電腦視覺模型。

作者介紹
(印)阿克謝·庫爾卡尼//阿達沙·希瓦南達//尼廷·奈傑·夏爾馬|責編:文開琪|譯者:歐拉

目錄
第1章  電腦視覺的基本構成
  1.1  什麼是電腦視覺
    1.1.1  應用
    1.1.2  通道
    1.1.3  卷積神經網路
    1.1.4  了解CNN架構類型
    1.1.5  掌握深度學習模型
    1.1.6  PyTorch簡介
  1.2  小結
第2章  圖像分類
  2.1  本章所涵蓋的主題
  2.2  方法概述
  2.3  創建圖像分類流程
    2.3.1  第一個基本模型
    2.3.2  數據
    2.3.3  數據探索
    2.3.4  數據載入器
    2.3.5  定義模型
    2.3.6  訓練過程
    2.3.7  基本模型的第二種變體
    2.3.8  基本模型的第三種變體
    2.3.9  基本模型的第四種變體
  2.7  小結
第3章  構建目標檢測模型
  3.1  使用 Boosted Cascade進行目標檢測
  3.2  R-CNN
    3.2.1  區域候選網路
    3.2.2  快速區域卷積神經網路
    3.2.3  候選區域網路的工作原理
    3.2.4  錨框生成層
    3.2.5  候選區域層
  3.3  Mask R-CNN
  3.4  YOLO
  3.5  YOLO V2/V3
  3.6  項目代碼片段
  3.7  小結
第4章  構建圖像分割模型
  4.1  圖像分割
  4.2  PyTorch預訓練支持
    4.2.1  語義分割
    4.2.2  實例分割
  4.3  模型優化
  4.4  小結
第5章  基於圖的搜索和推薦系統
  5.1  問題陳述
  5.2  方法和方法論
  5.3  實現
    5.3.1  數據集
    5.3.2  安裝和導入庫
    5.3.3  導入和理解數據

    5.3.4  特徵工程
    5.3.5  計算相似度和排名
    5.3.6  可視化推薦結果
    5.3.7  從用戶處接收圖輸入並推薦相似產品
  5.4  小結
第6章  姿態估計
  6.1  自頂向下的方法
  6.2  自底向上的方法
  6.3  OpenPose
    6.3.1  分支1
    6.3.2  分支2
  6.4  HRNet
  6.5  Higher HRNet
  6.6  PoseNet
    6.6.1  PoseNet工作機制
    6.6.2  PoseNet的優點和缺點
    6.6.3  姿態估計的應用
    6.6.4  在雜貨店視頻上進行的測試用例
  6.7  實現
  6.8  小結
第7章  圖像異常檢測
  7.1  異常檢測
  7.2  方法1:使用預訓練的分類模型
  7.3  方法2:使用自編碼器
  7.4  小結
第8章  圖像超解析度
  8.1  利用最近鄰概念放大圖像
  8.2  理解雙線性插值
  8.3  變分自編碼器
  8.4  生成式對抗網路
  8.5  模型代碼
  8.6  模型開發
  8.7  運行應用程序
  8.8  小結
第9章  視頻分析
  9.1  問題陳述
  9.2  方法
  9.3  實現
    9.3.1  數據
    9.3.2  把視頻上傳到Google Colab
    9.3.3  將視頻轉換為一系列圖像
    9.3.4  圖像提取
    9.3.5  數據預處理
    9.3.6  確定雜貨店中的熱點
    9.3.7  導入圖像
    9.3.8  獲取人群計數
    9.3.9  安保與監控
    9.3.10  確定人口統計學特徵(年齡和性別)
  9.4  小結
第10章  電腦視覺的可解釋AI

  10.1  Grad-CAM
  10.2  Grad-CAM
  10.3  NBDT
  10.4  Grad-CAM和Grad-CAM++的實現
    10.4.1  在單個圖像上的Grad-CAM和Grad-CAM++實現
    10.4.2  在單個圖像上的NBDT實現
  10.5  小結

  • 商品搜索:
  • | 高級搜索
首頁新手上路客服中心關於我們聯絡我們Top↑
Copyrightc 1999~2008 美商天龍國際圖書股份有限公司 臺灣分公司. All rights reserved.
營業地址:臺北市中正區重慶南路一段103號1F 105號1F-2F
讀者服務部電話:02-2381-2033 02-2381-1863 時間:週一-週五 10:00-17:00
 服務信箱:bookuu@69book.com 客戶、意見信箱:cs@69book.com
ICP證:浙B2-20060032