內容大鋼
構建通用人工智慧的關鍵就是無監督學習,而不需要標籤來訓練模型,最簡單的方法就是使用深度生成模型。本書主要講述如何將概率建模和深度學習結合起來去構建可以量化周邊環境不確定性的強大的AI系統。這種AI系統可以從生成的角度來理解周邊世界。本書涵蓋了深度生成模型的多種類型,包括自回歸模型、流模型、隱變數模型、基於能量的模型等。這些模型構成了以ChatGPT為代表的大語言模型,以及以Stable Diffusion為代表的擴散模型等深度生成模型背後的技術基石。
本書適合具備微積分、線性代數、概率論等大學本科水平,並且了解機器學習、Python及PyTorch等深度學習框架的學生、工程師和研究人員閱讀。無論讀者的背景如何,只要對深度生成模型有興趣,都能從本書中獲益。
作者介紹
(波蘭)傑克布·M.湯姆扎克|責編:孫學瑛|譯者:王冠
目錄
第1章 為什麼要用深度生成模型
1.1 AI不只是做決策
1.2 在哪裡使用(深度)生成模型
1.3 如何定義(深度)生成模型
1.3.1 自回歸模型
1.3.2 流模型
1.3.3 隱變數模型
1.3.4 能量模型
1.3.5 概論
1.4 本書的目的和內容
1.5 參考文獻
第2章 自回歸模型
2.1 簡介
2.2 由神經網路參數化的自回歸模型
2.2.1 有限記憶
2.2.2 基於循環神經網路的長距記憶
2.2.3 基於卷積神經網路的長距記憶
2.3 深度生成自回歸模型實踐
2.4 還未結束
2.5 參考文獻
第3章 流模型
3.1 連續隨機變數的流模型
3.1.1 簡介
3.1.2 深度生成網路中的變數替換
3.1.3 構建RealNVP的組件
3.1.4 流模型實踐
3.1.5 代碼
3.1.6 還未結束
3.1.7 ResNet流模型和DenseNet流模型
3.2 離散隨機變數的流模型
3.2.1 簡介
3.2.2 R中還是Z中的流模型
3.2.3 整形離散流模型
3.2.4 代碼
3.2.5 接下來的工作
3.3 參考文獻
第4章 隱變數模型
4.1 簡介
4.2 概率主成分分析
4.3 變分自動編碼器:非線性隱變數模型的變分推理
4.3.1 模型和目標
4.3.2 ELBO的不同解讀
4.3.3 VAE的組件
4.3.4 VAE實踐
4.3.5 代碼
4.3.6 VAE的常見問題
4.3.7 還有更多
4.4 改進變分自動編碼器
4.4.1 先驗
4.4.2 變分后驗
4.5 分層隱變數模型
4.5.1 簡介
4.5.2 分層VAE
4.5.3 基於擴散的深度生成模型
4.6 參考文獻
第5章 混合建模
5.1 簡介
5.1.1 方法一:從最簡單的情況開始
5.1.2 方法二:共享參數化
5.2 混合建模
5.3 代碼實現
5.4 代碼
5.5 後續
5.6 參考文獻
第6章 基於能量的模型
6.1 簡介
6.2 模型構建
6.3 訓練
6.4 代碼
6.5 受限玻爾茲曼機
6.6 結語
6.7 參考文獻
第7章 生成對抗網路
7.1 簡介
7.2 使用生成對抗網路做隱含建模
7.3 代碼實現
7.4 不同種類的生成對抗網路
7.5 參考文獻
第8章 用於神經壓縮的深度生成模型
8.1 簡介
8.2 通用壓縮方案
8.3 簡短介紹:JPEG
8.4 神經壓縮:組件
8.5 後續
8.6 參考文獻
附錄A 一些有用的代數與運算知識
A.1 范數與內積
A.2 矩陣運算
附錄B 一些有用的概率論和統計學知識
B.1 常用概率分佈
B.2 統計學
索引