幫助中心 | 我的帳號 | 關於我們

大模型原理與技術(人工智慧通識教育精品教材)

  • 作者:編者:魏明強//陳松燦//宮麗娜|責編:杜軍
  • 出版社:電子工業
  • ISBN:9787121488931
  • 出版日期:2024/09/01
  • 裝幀:平裝
  • 頁數:343
人民幣:RMB 69 元      售價:
放入購物車
加入收藏夾

內容大鋼
    大模型作為人工智慧技術的重要發展方向,逐漸成為未來科技發展的重要方向之一。基於此,本書重點介紹與大模型相關的基礎知識、原理與技術。本書內容包括深度學習基礎、自然語言處理、大模型網路結構、大模型訓練與優化、大模型微調及相關應用案例等。全書強調內容的科學性與系統性,從大模型歷史發展脈絡、理論基礎、構建方法到應用場景,循序漸進地全面講解大模型技術。本書聚焦于大模型在不同領域的擴展應用,提供了應用案例的全方位學習路徑,旨在培養和提升學生的實踐和創造能力。每章都提供了相應的習題,供學生練習和鞏固知識。同時,本書通過介紹開源框架「計圖」、華為晶元、航空航天裝備製造等知識,可以讓學生了解更多國產技術。
    本書適合作為科研院所和本科院校電腦、人工智慧、機械製造與自動化等相關專業的教材,也可以作為高職高專院校的教學參考書。

作者介紹
編者:魏明強//陳松燦//宮麗娜|責編:杜軍

目錄
第1章  緒論
  1.1  大模型基本概念
  1.2  大模型發展歷程
    1.2.1  從技術架構看發展歷程
    1.2.2  從參數規模看發展歷程
    1.2.3  從模態支持看發展歷程
    1.2.4  從應用領域看發展歷程
  1.3  大模型關鍵技術及訓練流程
    1.3.1  大模型關鍵技術
    1.3.2  大模型訓練流程
  1.4  本書內容安排
  1.5  思考
  習題1
第2章  深度學習基礎
  2.1  神經網路基礎
    2.1.1  神經網路
    2.1.2  卷積神經網路
  2.2  損失函數和優化演算法
    2.2.1  損失函數
    2.2.2  優化演算法
  2.3  神經網路訓練
    2.3.1  梯度和鏈式法則
    2.3.2  前向傳播與反向傳播
    2.3.3  訓練神經網路示例
  2.4  深度學習框架
    2.4.1  主流深度學習框架
    2.4.2  框架選擇和優缺點比較
  2.5  思考
  習題2
第3章  自然語言處理
  3.1  自然語言處理概述
    3.1.1  基本任務
    3.1.2  發展歷程
    3.1.3  應用領域
  3.2  詞嵌入
    3.2.1  獨熱向量
    3.2.2  Word2vec
    3.2.3  代碼示例
  3.3  循環神經網路
    3.3.1  循環神經網路介紹
    3.3.2  循環神經網路訓練
    3.3.3  循環神經網路梯度問題
    3.3.4  雙向循環神經網路
  3.4  長短期記憶網路
    3.4.1  長短期記憶網路介紹
    3.4.2  長短期記憶網路應用
  3.5  門控循環單元
    3.5.1  門控循環單元介紹
    3.5.2  門控循環單元應用
  3.6  思考

  習題3
第4章  大模型網路結構
  4.1  Transformer
    4.1.1  注意力機制
    4.1.2  編碼器-解碼器結構
    4.1.3  大模型中的編碼器-解碼器結構
  4.2  編碼器結構—BERT家族
    4.2.1  BERT結構
    4.2.2  預訓練策略
    4.2.3  BERT的變體
  4.3  解碼器結構—GPT家族
    4.3.1  GPT結構
    4.3.2  自回歸預訓練
    4.3.3  後續改進
  4.4  思考
  習題4
第5章  大模型訓練與優化
  5.1  訓練數據準備
    5.1.1  數據獲取
    5.1.2  數據預處理
    5.1.3  數據增強
    5.1.4  數據配比與課程設置
    5.1.5  開源數據集
  5.2  並行化和分散式訓練
    5.2.1  大模型訓練的挑戰
    5.2.2  並行策略
    5.2.3  節點間數據通信
    5.2.4  分散式訓練框架
  5.3  模型壓縮
    5.3.1  量化
    5.3.2  剪枝
    5.3.3  知識蒸餾
  5.4  華為晶元助力大模型訓練與部署
    5.4.1  AscendAI晶元
    5.4.2  Atlas系列硬體
    5.4.3  異構計算架構CANN
    5.4.4  深度學習框架MindSpore
    5.4.5  應用使能與行業應用
  5.5  思考
  習題5
第6章  大模型微調
  6.1  大模型微調概述
  6.2  參數高效微調
    6.2.1  增量式微調
    6.2.2  指定式微調
    6.2.3  重參數化微調
    6.2.4  混合微調
    6.2.5  小結
  6.3  指令微調
    6.3.1  指令數據集構建

    6.3.2  指令微調階段
  6.4  基於人類反饋的強化學習微調
    6.4.1  獎勵建模
    6.4.2  強化學習微調
    6.4.3  案例講解
  6.5  思考
  習題6
第7章  大模型提示工程
  7.1  提示工程簡介
  7.2  零樣本提示
  7.3  少樣本提示
  7.4  鏈式思考提示
    7.4.1  思維鏈提示工程概述
    7.4.2  零樣本思維鏈
    7.4.3  思維鏈拓展
  7.5  思維樹提示
  7.6  檢索增強生成
  7.7  自動提示工程
  7.8  思考
  習題7
第8章  高效大模型策略
  8.1  大模型效率概述
    8.1.1  大模型效率面臨的問題
    8.1.2  大模型效率及其評估指標
  8.2  預算效率策略:縮放定律
  8.3  數據效率策略
    8.3.1  數據過濾
    8.3.2  主動學習/重要性採樣
    8.3.3  課程學習
  8.4  架構效率策略
    8.4.1  高效注意力
    8.4.2  高效位置編碼
    8.4.3  稀疏模型
    8.4.4  無注意力模型
  8.5  訓練效率策略
    8.5.1  穩定訓練策略
    8.5.2  混合精度訓練
    8.5.3  並行訓練技術
    8.5.4  內存優化
  8.6  推理效率策略
    8.6.1  剪枝
    8.6.2  知識蒸餾
    8.6.3  量化
    8.6.4  低秩分解
  8.7  微調效率策略
    8.7.1  參數高效微調
    8.7.2  數據高效調整
  8.8  思考
  習題8
第9章  單模態通用大模型

  9.1  LLaMA:一種自然語言處理大模型
    9.1.1  模型結構
    9.1.2  預訓練
    9.1.3  微調
    9.1.4  使用方法
  9.2  SAM:一種圖像分割大模型
    9.2.1  概述
    9.2.2  提示下的圖像分割任務
    9.2.3  SAM模型架構
    9.2.4  SA-1B:大規模掩碼數據集
    9.2.5  SAM在各視覺任務中的應用
    9.2.6  SAM的使用方法
  9.3  AudioLM:讓AI為你譜曲寫歌
    9.3.1  概述
    9.3.2  AudioLM的組件構成
    9.3.3  AudioLM的訓練方式
    9.3.4  AudioLM的安裝與使用
    9.3.5  AudioLM的推理應用
  9.4  Zero-1-to-3:二生三維
    9.4.1  概述
    9.4.2  Zero-1-to-3模型結構
    9.4.3  Zero-1-to-3的使用
  9.5  思考
  習題9
第10章  多模態通用大模型
  10.1  多模態數據集介紹
    10.1.1  GQA數據集
    10.1.2  HowTo100M數據集
    10.1.3  Conceptual-12M數據集
    10.1.4  YT-Temporal-180M數據集
    10.1.5  WebVid-2M數據集
    10.1.6  ModelNet數據集
    10.1.7  ShapeNet數據集
    10.1.8  ScanObjectNN數據集
    10.1.9  KITTI數據集
    10.1.10  nuScenes數據集
    10.1.11  Waymo數據集
  10.2  CLIP:探索圖文結合的奧秘
    10.2.1  概述
    10.2.2  模型架構
    10.2.3  訓練過程
    10.2.4  CLIP相關應用
    10.2.5  CLIP的不足
  10.3  GPT-4V:大模型視覺能力的新篇章
    10.3.1  輸入模式
    10.3.2  工作方式
    10.3.3  視覺語言能力
  10.4  ImageBind:多感官統一
    10.4.1  概述
    10.4.2  多模態特徵編碼與對齊

    10.4.3  數據集的靈活應用
    10.4.4  相關應用
    10.4.5  使用方法
  10.5  3D-LLM:將三維世界注入大模型
    10.5.1  三維語言數據生成
    10.5.2  3D-LLM訓練方式
    10.5.3  3D-LLM安裝與實現細節
    10.5.4  3D-LLM應用圖譜
  10.6  Sora:文生視頻
    10.6.1  Sora為視頻生成帶來的改變
    10.6.2  Sora的局限性與爭議
  10.7  思考
  習題10
第11章  大模型評測
  11.1  大模型評測概述
  11.2  知識和能力評測
    11.2.1  問答能力
    11.2.2  知識補全能力
    11.2.3  推理能力
    11.2.4  工具學習能力
  11.3  對齊評測
    11.3.1  倫理道德
    11.3.2  偏見
    11.3.3  有害內容
    11.3.4  真實性
  11.4  安全評測
    11.4.1  魯棒性評測
    11.4.2  風險評測
  11.5  行業大模型評測
    11.5.1  醫學
    11.5.2  教育學
    11.5.3  電腦科學
    11.5.4  金融學
  11.6  思考
  習題11
第12章  大模型主要應用場景
  12.1  大模型產業圖譜
  12.2  大模型軍事智能應用
  12.3  大模型教育教學應用
  12.4  大模型醫療健康應用
  12.5  大模型工業應用
  12.6  大模型氣象預報應用
  12.7  大模型測繪應用
  12.8  思考
  習題12
第13章  基於大模型的智能軟體研發
  13.1  基於大模型的智能軟體研發框架
  13.2  智能軟體研發中的大模型技術
    13.2.1  常用大模型
    13.2.2  預訓練範式

  13.3  智能軟體研發中的下游任務
    13.3.1  程序語言相關任務
    13.3.2  自然語言相關任務
    13.3.3  程序語言與自然語言交互任務
  13.4  常用數據集
    13.4.1  預訓練數據集
    13.4.2  下游任務數據集
  13.5  思考
  習題13
第14章  基於大模型的航空航天裝備製造
  14.1  大模型在大飛機製造中的應用
    14.1.1  大飛機製造概述
    14.1.2  設計和優化中的應用
  14.2  大模型在航空發動機中的應用
    14.2.1  航空發動機概述
    14.2.2  具體應用場景
  14.3  大模型在航空機載設備與系統中的應用
    14.3.1  航空機載設備與系統概述
    14.3.2  具體應用場景
  14.4  大模型在無人機智能集群中的應用
    14.4.1  無人機智能集群概述
    14.4.2  具體應用場景
    14.4.3  典型應用案例
  14.5  思考
  習題14
參考文獻

  • 商品搜索:
  • | 高級搜索
首頁新手上路客服中心關於我們聯絡我們Top↑
Copyrightc 1999~2008 美商天龍國際圖書股份有限公司 臺灣分公司. All rights reserved.
營業地址:臺北市中正區重慶南路一段103號1F 105號1F-2F
讀者服務部電話:02-2381-2033 02-2381-1863 時間:週一-週五 10:00-17:00
 服務信箱:bookuu@69book.com 客戶、意見信箱:cs@69book.com
ICP證:浙B2-20060032