幫助中心 | 我的帳號 | 關於我們

深度學習編譯器設計

  • 作者:編者:高偉//韓林//李嘉楠|責編:楊迪娜
  • 出版社:清華大學
  • ISBN:9787302675518
  • 出版日期:2024/11/01
  • 裝幀:平裝
  • 頁數:318
人民幣:RMB 89 元      售價:
放入購物車
加入收藏夾

內容大鋼
    隨著大模型的發展與應用,深度學習編譯器的內涵和外延逐步擴展。與傳統編譯器相比,深度學習編譯器增加了特定於人工智慧模型實現的設計與優化。本書共12章。第1章從深度學習的起源、發展與爆發出發,引出深度學習模型的基礎概念、深度學習應用的開發流程和深度學習框架。第2章介紹深度學習運算特徵、深度學習硬體平台和深度學習編譯技術,通過分析典型深度學習編譯器的架構,給出深度學習編譯器的一般架構。第3章介紹面向深度學習應用開發的編程模型和編程介面。第4章從計算圖的構成、分類、轉換和分析4個角度,介紹深度學習編譯器前端的工作流程。第5章從中間表示的概念、分類和設計3個角度,分析深度學習編譯器中間表示的設計方法和重要作用。第6?12章介紹深度學習編譯優化,包括自動微分、計算圖優化、內存分配與優化、運算元選擇與生成、代碼生成與優化、自動並行及模型推理等。
    本書可作為電腦科學與技術專業、軟體工程專業的教學參考書,也可供人工智慧大模型性能優化人員參考。

作者介紹
編者:高偉//韓林//李嘉楠|責編:楊迪娜

目錄
第1章  深度學習簡介
  1.1  深度學習的起源、發展與爆發
    1.1.1  深度學習的起源
    1.1.2  深度學習的發展
    1.1.3  深度學習的爆發
  1.2  深度學習模型的基礎概念
    1.2.1  深度學習模型的組成
    1.2.2  深度學習模型的運行
    1.2.3  深度學習模型的分類
  1.3  深度學習應用的開發流程
    1.3.1  通用開發流程
    1.3.2  特定領域典型應用的開發流程
  1.4  深度學習框架
    1.4.1  發展歷程
    1.4.2  典型框架
    1.4.3  核心組件
第2章  深度學習編譯簡介
  2.1  深度學習運算特徵
    2.1.1  深度學習中的矩陣運算
    2.1.2  大規模矩陣運算面臨的挑戰
  2.2  深度學習硬體平台
    2.2.1  深度學習硬體技術架構
    2.2.2  深度學習硬體應用挑戰
  2.3  深度學習編譯技術
    2.3.1  典型深度學習編譯器
    2.3.2  深度學習編譯器的結構
第3章  編程模型與編程介面
  3.1  編程模型
    3.1.1  任務劃分
    3.1.2  數據分佈
    3.1.3  通信和同步
    3.1.4  任務映射
    3.1.5  兼容性及發展趨勢
  3.2  編程介面
    3.2.1  基於C/C++的介面
    3.2.2  基於Python的介面
    3.2.3  Python調用C/C++的綁定技術
第4章  前端
  4.1  計算圖構成
    4.1.1  數據節點
    4.1.2  計算節點
    4.1.3  控制節點
    4.1.4  依賴邊
  4.2  計算圖分類
    4.2.1  靜態計算圖
    4.2.2  動態計算圖
  4.3  計算圖轉換
    4.3.1  動靜結合技術
    4.3.2  動靜統一技術
  4.4  計算圖分析

    4.4.1  類型系統
    4.4.2  類型推導
    4.4.3  類型轉換
    4.4.4  形狀推導
第5章  中間表示
  5.1  中間表示的概念
  5.2  中間表示的分類
    5.2.1  線性中間表示
    5.2.2  圖中間表示
    5.2.3  混合中間表示
  5.3  中間表示的設計
    5.3.1  單層中間表示設計
    5.3.2  兩層中間表示設計
    5.3.3  多層中間表示設計
第6章  自動微分
  6.1  自動微分的概念
  6.2  自動微分的模式
    6.2.1  前向模式
    6.2.2  反向模式
  6.3  自動微分的實現
    6.3.1  基本表達式法
    6.3.2  操作符重載法
    6.3.3  源碼轉換法
第7章  計算圖優化
  7.1  運算元融合
    7.1.1  融合規則
    7.1.2  融合策略
    7.1.3  內存融合
    7.1.4  並行融合
    7.1.5  動態融合
  7.2  混合精度改寫
  7.3  數據布局轉換
  7.4  其他圖優化方法
    7.4.1  常量摺疊
    7.4.2  公共子表達式消除
    7.4.3  代數化簡
第8章  內存分配與優化
  8.1  內存分配
  8.2  內存復用
    8.2.1  原地置換
    8.2.2  內存共享
  8.3  張量遷移
    8.3.1  遷移機制
    8.3.2  遷移優化
  8.4  重計算
    8.4.1  靜態圖重計算
    8.4.2  動態圖重計算
    8.4.3  快速注意力機制
第9章  運算元選擇與生成
  9.1  運算元選擇

  9.2  運算元生成
    9.2.1  基於機器學習的運算元生成
    9.2.2  基於多面體變換的運算元生成
第10章  代碼生成與優化
  10.1  過程間優化
  10.2  循環優化
    10.2.1  循環展開
    10.2.2  循環合併
    10.2.3  循環分佈
    10.2.4  循環剝離
    10.2.5  循環分段
    10.2.6  循環分塊
    10.2.7  循環交換
  10.3  語句級優化
    10.3.1  冗余語句刪除
    10.3.2  公共子表達式消除
  10.4  指令級優化
    10.4.1  指令流水
    10.4.2  超標量
    10.4.3  超長指令字
  10.5  自動並行化
    10.5.1  自動向量化
    10.5.2  自動張量化
    10.5.3  自動OpenMP並行化
  10.6  訪存優化
    10.6.1  寄存器優化
    10.6.2  內存優化
第11章  自動並行
  11.1  並行劃分
    11.1.1  數據並行劃分
    11.1.2  模型並行劃分
    11.1.3  序列並行劃分
    11.1.4  混合併行劃分
  11.2  並行策略
    11.2.1  搜索空間
    11.2.2  代價模型
    11.2.3  搜索演算法
  11.3  通信優化
    11.3.1  通信優化基礎
    11.3.2  通信優化策略
第12章  模型推理
  12.1  模型部署
    12.1.1  部署工具
    12.1.2  部署方式
  12.2  模型壓縮
    12.2.1  量化
    12.2.2  剪枝
    12.2.3  知識蒸餾
  12.3  推理加速
    12.3.1  圖優化

    12.3.2  演算法優化
    12.3.3  運行時優化
參考文獻

  • 商品搜索:
  • | 高級搜索
首頁新手上路客服中心關於我們聯絡我們Top↑
Copyrightc 1999~2008 美商天龍國際圖書股份有限公司 臺灣分公司. All rights reserved.
營業地址:臺北市中正區重慶南路一段103號1F 105號1F-2F
讀者服務部電話:02-2381-2033 02-2381-1863 時間:週一-週五 10:00-17:00
 服務信箱:bookuu@69book.com 客戶、意見信箱:cs@69book.com
ICP證:浙B2-20060032