內容大鋼
本書在前三版的基礎上,為適應電腦視覺領域的革命性變化——深度學習的出現,出版了第四版。更新內容主要體現在:偽代碼描述改用Python和MATLAB(放棄了Mathcad);新增闡述深度學習,包括主要的深度網路結構、學習得到的深度特徵和性能評價。此外,本書還補充了雙向濾波、Krawtchouk矩、超像素、空時興趣點和更多的距離測度等。總之,本書既涵蓋基礎,又突出重點,全面闡述了邊緣檢測、固定形狀匹配、可變形狀分析、目標描述、基於區域的分析和運動對象檢測及描述等低級和高級特徵提取方法。
本書適合作為電子工程、電腦科學、電腦工程等專業的本科雙語教學教材,也適合圖像及視頻信號處理、模式識別和電腦視覺方向的研究生參考閱讀。
目錄
Chapter 1 Introduction 緒論
1.1 Overview 概述
1.2 Human and computer vision 人類視覺和電腦視覺
1.3 The human vision system 人類視覺系統
1.3.1 The eye 眼睛
1.3.2 The neural system 神經系統
1.3.3 Processing 處理系統
1.4 Computer vision systems 電腦視覺系統
1.4.1 Cameras 照相機
1.4.2 Computer interfaces 電腦介面
1.5 Processing images 圖像處理
1.5.1 Processing 處理
1.5.2 Hello Python, hello images Python 圖像初探
1.5.3 Mathematical tools 數學工具
1.5.4 Hello Matlab MATLAB 圖像初探
1.6 Conclusions 小結
References 參考文獻
Chapter 2 Images, sampling and frequency domain processing 圖像、採樣和頻域處理
2.1 Overview 概述
2.2 Image formation 圖像形成
2.3 The Fourier Transform 傅里葉變換
2.4 The sampling criterion 採樣準則
2.5 The discrete Fourier Transform 離散傅里葉變換
2.5.1 One-dimensional transform 一維變換
2.5.2 Two-dimensional transform 二維變換
2.6 Properties of the Fourier Transform 傅里葉變換的特性
2.6.1 Shift invariance 位移不變性
2.6.2 Rotation 旋轉
2.6.3 Frequency scaling 頻率尺度變化
2.6.4 Superposition (linearity) 疊加(線性)
2.6.5 The importance of phase 相位的重要性
2.7 Transforms other than Fourier 除傅里葉變換以外的其他變換
2.7.1 Discrete cosine transform 離散餘弦變換
2.7.2 Discrete Hartley Transform 離散Hartley變換
2.7.3 Introductory wavelets 小波簡介
2.7.4 Other transforms 其他變換
2.8 Applications using frequency domain properties 頻域特性的應用
2.9 Further reading 擴展閱讀
References 參考文獻
Chapter 3 Image processing 圖像處理運算
3.1 Overview 概述
3.2 Histograms 直方圖
3.3 Point operators 點運算
3.3.1 Basic point operations 基本點運算
3.3.2 Histogram normalisation 直方圖歸一化
3.3.3 Histogram equalisation 直方圖均衡化
3.3.4 Thresholding 閾值處理
3.4 Group operations 組運算
3.4.1 Template convolution 模板卷積
3.4.2 Averaging operator 平均運算元
3.4.3 On different template size 不同的模板大小
3.4.4 Template convolution via the Fourier transform 利用傅里葉變換的模板卷積
3.4.5 Gaussian averaging operator 高斯平均運算元
3.4.6 More on averaging 更多平均處理
3.5 Other image processing operators 其他圖像處理操作
3.5.1 Median filter 中值濾波
3.5.2 Mode filter 眾數濾波
3.5.3 Nonlocal means 非局部均值
3.5.4 Bilateral filtering 雙邊濾波
3.5.5 Anisotropic diffusion 各向異性擴散
3.5.6 Comparison of smoothing operators 各種平滑運算元的比較
3.5.7 Force field transform 力場變換
3.5.8 Image ray transform 圖像射線變換
3.6 Mathematical morphology 數學形態學
3.6.1 Morphological operators 形態學運算元
3.6.2 Grey level morphology 灰度形態學
3.6.3 Grey level erosion and dilation 灰度圖像的腐蝕和膨脹
3.6.4 Minkowski operators Minkowski 運算元
3.7 Further reading 擴展閱讀
References 參考文獻
Chapter 4 Low-level feature extraction (including edge detection) 低級特徵提取(包括邊緣檢測)
4.1 Overview 概述
4.2 Edge detection 邊緣檢測
4.2.1 First-order edge detection operators 一階邊緣檢測運算元
4.2.2 Second-order edge detection operators 二階邊緣檢測運算元
4.2.3 Other edge detection operators 其他邊緣檢測運算元
4.2.4 Comparison of edge detection operators 邊緣檢測運算元的比較
4.2.5 Further reading on edge detection 關於邊緣檢測的擴展閱讀
4.3 Phase congruency 相位一致性
4.4 Localised feature extraction 定位特徵提取
4.4.1 Detecting image curvature (corner extraction) 檢測圖像曲率(角點提取)
4.4.2 Feature point detection: region/patch analysis 特徵點檢測:區域/樣本塊分析
4.4.3 Saliency 顯著度
4.5 Describing image motion 描述圖像運動
4.5.1 Area-based approach 基於區域的方法
4.5.2 Differential approach 差分方法
4.5.3 Recent developments: deep flow, epic flow and extensions 新近發展:深度流,epic流和擴展
4.5.4 Analysis of optical flow 光流的分析
4.6 Further reading 擴展閱讀
References 參考文獻
Chapter 5 High-level feature extraction: fixed shape matching 高級特徵提取:固定形狀匹配
5.1 Overview 概述
5.2 Thresholding and subtraction 閾值處理和背景減
5.3 Template matching 模板匹配
5.3.1 Definition 定義
5.3.2 Fourier transform implementation 傅里葉變換實現
5.3.3 Discussion of template matching 模板匹配的討論
5.4 Feature extraction by low-level features 低級特徵提取
5.4.1 Appearance-based approaches 基於外觀的方法
5.4.2 Distribution-based descriptors 基於分佈的描述符
5.5 Hough transform 霍夫變換
5.5.1 Overview 概述
5.5.2 Lines 直線
5.5.3 HT for circles 基於霍夫變換的圓檢測
5.5.4 HT for ellipses 基於霍夫變換的橢圓檢測
5.5.5 Parameter space decomposition 參數空間分解
5.5.6 Generalised Hough transform 廣義霍夫變換
5.5.7 Other extensions to the HT 霍夫變換的其他擴展
5.6 Further reading 擴展閱讀
References 參考文獻
Chapter 6 High-level feature extraction: deformable shape analysis 高級特徵提取:可變形形狀分析
6.1 Overview 概述
6.2 Deformable shape analysis 可變形形狀分析
6.2.1 Deformable templates 可變形模板
6.2.2 Parts-based shape analysis 基於部件的形狀分析
6.3 Active contours (snakes) 主動輪廓(蛇模型)
6.3.1 Basics 基礎知識
6.3.2 The Greedy Algorithm for snakes 蛇模型的貪心演算法
6.3.3 Complete (Kass) Snake implementation 完全(Kass)蛇模型實現
6.3.4 Other Snake approaches 其他蛇模型方法
6.3.5 Further Snake developments 蛇模型的進一步發展
6.3.6 Geometric active contours (Level Set-Based Approaches) 幾何主動輪廓(水平集方法)
6.4 Shape Skeletonisation 形狀骨架化
6.4.1 Distance transforms 距離變換
6.4.2 Symmetry 對稱性
6.5 Flexible shape models–active shape and active appearance 靈活的形狀模型——主動形狀和主動外觀
6.6 Further reading 擴展閱讀
References 參考文獻
Chapter 7 Object description 目標描述
7.1 Overview and invariance requirements 概述和不變性要求
7.2 Boundary descriptions 邊界描述
7.2.1 Boundary and region 邊界和區域
7.2.2 Chain codes 鏈碼
7.2.3 Fourier descriptors 傅里葉描述符
7.3 Region descriptors 區域描述符
7.3.1 Basic region descriptors 基本區域描述符
7.3.2 Moments 矩
7.4 Further reading 擴展閱讀
References 參考文獻
Chapter 8 Region-based analysis 基於區域的分析
8.1 Overview 概述
8.2 Region-based analysis 基於區域的分析
8.2.1 Watershed transform 分水嶺變換
8.2.2 Maximally stable extremal regions 最大穩定極值區域
8.2.3 Superpixels 超像素
8.3 Texture description and analysis 紋理描述與分析
8.3.1 What is texture 什麼是紋理
8.3.2 Performance requirements 性能要求
8.3.3 Structural approaches 結構法
8.3.4 Statistical approaches 統計法
8.3.5 Combination approaches 組合法
8.3.6 Local binary patterns 局部二值模式
8.3.7 Other approaches 其他方法
8.3.8 Segmentation by texture 基於紋理的分割
8.4 Further reading 擴展閱讀
References 參考文獻
Chapter 9 Moving object detection and description 運動對象檢測與描述
9.1 Overview 概述
9.2 Moving object detection 運動對象檢測
9.2.1 Basic approaches 基本方法
9.2.2 Modelling and adapting to the (static) background 建模並適應(靜止)背景
9.2.3 Background segmentation by thresholding 通過閾值化進行背景分割
9.2.4 Problems and advances 問題與進展
9.3 Tracking moving features 跟蹤運動特徵
9.3.1 Tracking moving objects 跟蹤運動目標
9.3.2 Tracking by local search 通過局部搜索進行跟蹤
9.3.3 Problems in tracking 跟蹤中的問題
9.3.4 Approaches to tracking 跟蹤方法
9.3.5 Meanshift and Camshift Meanshift與Camshift
9.3.6 Other approaches 其他方法
9.4 Moving feature extraction and description 運動特徵提取與描述
9.4.1 Moving (biological) shape analysis 運動(生物)的形狀描述
9.4.2 Space–time interest points 空時興趣點
9.4.3 Detecting moving shapes by shape matching in image sequences 基於形狀匹配的運動形狀檢測
9.4.4 Moving shape description 運動形狀描述
9.5 Further reading 擴展閱讀
References 參考文獻
Chapter 10 Camera geometry fundamentals 照相機幾何基礎
10.1 Overview 概述
10.2 Projective space 投影空間
10.2.1 Homogeneous co-ordinates and projective geometry 齊次坐標和投影幾何
10.2.2 Representation of a line, duality and ideal points 直線的表示法、對偶性和理想點
10.2.3 Transformations in the projective space 投影空間的變換
10.2.4 Computing a planar homography 計算共點面成像
10.3 The perspective camera 透視照相機
10.3.1 Perspective camera model 透視照相機模型分析
10.3.2 Parameters of the perspective camera model 透視照相機模型的參數
10.3.3 Computing a projection from an image 根據圖像計算投影
10.4 Affine camera 仿射照相機
10.4.1 Affine camera model 仿射照相機模型
10.4.2 Affine camera model and the perspective projection 仿射照相機模型和透視投影
10.4.3 Parameters of the affine camera model 仿射照相機模型的參數
10.5 Weak perspective model 弱透視模型
10.6 Discussion 討論
10.7 Further reading 擴展閱讀
References 參考文獻
Chapter 11 Colour images 彩色圖像
11.1 Overview 概述
11.2 Colour image theory 彩色圖像理論
11.2.1 Colour images 彩色圖像
11.2.2 Tristimulus theory 三刺激理論
11.2.3 The colourimetric equation 比色等式
11.2.4 Luminosity function 光譜視亮度函數
11.3 Perception-based colour models: CIE RGB and CIE XYZ 基於感知的顏色模型:CIE RGB與CIE XYZ
11.3.1 CIE RGB colour model: Wright–Guild data 根據Wright Guild 數據構造CIE RGB顏色模型
11.3.2 CIE RGB colour matching functions CIE RGB顏色匹配函數
11.3.3 CIE RGB chromaticity diagram and chromaticity co-ordinates CIE RGB 色度表和色度坐標
11.3.4 CIE XYZ colour model CIE XYZ顏色模型
11.3.5 CIE XYZ colour matching functions CIE XYZ顏色匹配函數
11.3.6 XYZ chromaticity diagram XYZ色度表
11.3.7 Uniform colour spaces: CIE LUV and CIE LAB 均勻顏色空間:CIE LUV和CIE LAB
11.4 Additive and subtractive colour models 加性和減性顏色模型
11.4.1 RGB and CMY RGB和CMY顏色模型
11.4.2 Transformation between RGB models RGB顏色模型之間的變換
11.4.3 Transformation between RGB and CMY models RGB和CMY顏色模型之間的變換
11.5 Luminance and chrominance colour models 亮度和色度模型
11.5.1 YUV, YIQ and YCbCr models YUV, YIQ和YCbCr模型
11.5.2 Luminance and gamma correction 亮度和伽馬修正
11.5.3 Chrominance 色度
11.5.4 Transformations between YUV, YIQ and RGB colour models YUV, YIQ和RGB顏色模型之間的變換
11.5.5 Colour model for component video: YPbPr 分量視頻的顏色模型:YPbPr
11.5.6 Colour model for digital video: YCbCr 數字視頻的顏色模型:YCbCr
11.6 Additive perceptual colour models 加性的感知顏色模型
11.6.1 The HSV and HLS colour models HSV和HLS顏色模型
11.6.2 The hexagonal model: HSV 六邊形模型:HSV
11.6.3 The triangular model: HLS 三角形模型:HLS
11.6.4 Transformation between HLS and RGB HLS和RGB之間的變換
11.7 More colour models 更多的顏色模型
References 參考文獻
Chapter 12 Distance, classification and learning 距離、分類和學習
12.1 Overview 概述
12.2 Basis of classification and learning 分類和學習基礎
12.3 Distance and classification 距離和分類
12.3.1 Distance measures 距離測度
12.3.2 The k-nearest neighbour for classification k最近鄰分類
12.4 Neural networks and Support Vector Machines 神經網路和支持向量機
12.5 Deep learning 深度學習
12.5.1 Basis of deep learning 深度學習基礎
12.5.2 Major deep learning architectures 主要的深度學習網路結構
12.5.3 Deep learning for feature extraction 面向特徵提取的深度學習
12.5.4 Deep learning performance evaluation 深度學習性能評價
12.6 Further reading 進一步閱讀
References 參考文獻