幫助中心 | 我的帳號 | 關於我們

大語言模型基礎(微課視頻版)/21世紀人工智慧創新與應用叢書

  • 作者:編者:周蘇//楊武劍|責編:張玥
  • 出版社:清華大學
  • ISBN:9787302672869
  • 出版日期:2024/09/01
  • 裝幀:平裝
  • 頁數:215
人民幣:RMB 59.8 元      售價:
放入購物車
加入收藏夾

內容大鋼
    大語言模型(簡稱大模型)是一種基於深度學習技術的先進人工智慧模型,特別適用於理解和生成自然語言文本,它具有文生文、文生圖、文生視頻甚至未來的文生X等多種多模態形式。大模型的多功能性和通用性,使其能夠在未經專門訓練的情況下處理多種類型的自然語言任務。隨著技術的發展,大模型已經成為自然語言處理領域的重要基石,並持續推動著人工智慧技術的進步和社會應用的拓展。學習大模型課程不僅有利於個人專業成長,更能對社會進步和技術創新產生積極影響。人工智慧及其大模型技術,是每個高校學生甚至社會人必須關注、學習和重視的知識與現實。
    本書介紹的大模型知識主要包括大模型基礎、模型與生成式AI、大模型架構、人工數據標注、大模型預訓練數據、大模型開發組織、提示工程與微調、強化學習方法、大模型智能體、大模型應用框架、技術倫理與限制、大模型產品評估等。
    本書特色鮮明,易讀易學,適合高等院校電腦、大數據、人工智慧等相關專業學生學習,也適合對人工智慧以及大模型相關領域感興趣的讀者閱讀參考。

作者介紹
編者:周蘇//楊武劍|責編:張玥

目錄
第1章  大模型基礎
  1.1  人工智慧基礎
    1.1.1  人工智慧的實現途徑
    1.1.2  機器學習和深度學習
    1.1.3  監督與無監督學習
  1.2  大模型定義
    1.2.1  模型預訓練和微調
    1.2.2  大模型的特徵
    1.2.3  大模型的優勢
  1.3  大模型技術的形成
    1.3.1  Blockhead思維實驗
    1.3.2  大模型的歷史基礎
    1.3.3  基於Transformer模型
    1.3.4  大模型的世界模型問題
    1.3.5  文化知識傳遞和語言支持
  1.4  通用人工智慧
    1.4.1  什麼是通用人工智慧
    1.4.2  大模型與通用人工智慧
    1.4.3  人工智慧生成內容
  【作業】
  【實踐與思考】了解典型的開源大模型
第2章  大模型與生成式AI
  2.1  什麼是語言模型
    2.1.1  語言模型的定義
    2.1.2  注意力機制
    2.1.3  開源還是閉源
  2.2  大模型發展三階段
    2.2.1  基礎模型階段
    2.2.2  能力探索階段
    2.2.3  突破發展階段
  2.3  Transformer模型
    2.3.1  Transformer過程
    2.3.2  Transformer結構
    2.3.3  Transformer模塊
  2.4  生成式人工智慧
    2.4.1  生成式AI定義
    2.4.2  生成式AI層次
    2.4.3  生成式預訓練語言模型GPT
  【作業】
  【實踐與思考】基於ChatGPT的免費工具:ChatAI小組件
第3章  大模型架構
  3.1  大模型生成原理
    3.1.1  上下文學習
    3.1.2  指令微調
    3.1.3  零樣本/少樣本
    3.1.4  深度學習架構
    3.1.5  訓練策略及優化技術
    3.1.6  所謂世界模型
  3.2  多模態語言模型
    3.2.1  多模態指令微調

    3.2.2  多模態上下文學習
    3.2.3  多模態思維鏈
    3.2.4  大模型輔助視覺推理
  3.3  大模型的結構
    3.3.1  LLaMA的模型結構
    3.3.2  LLaMA的注意力機制
  3.4  應用技術架構
    3.4.1  指令工程
    3.4.2  函數調用
    3.4.3  檢索增強生成
    3.4.4  微調
  3.5  OpenAI的Sora大模型
    3.5.1  Sora技術報告分析
    3.5.2  Sora的主要技術特點
    3.5.3  Sora的模型訓練過程
  【作業】
  【實踐與思考】熟悉阿里雲大模型「通義千問」
第4章  人工數據標注
  4.1  知識表示方法
    4.1.1  知識的概念
    4.1.2  知識表示的定義
    4.1.3  知識表示的過程
  4.2  什麼是數據標注
  4.3  數據標注分類
    4.3.1  圖像標注
    4.3.2  語音標注
    4.3.33  D點雲標注
    4.3.4  文本標注
  4.4  制定標注規則
  4.5  執行數據標注
  4.6  標注團隊管理
  【作業】
  【實踐與思考】熟悉百度大模型「文心一言」
第5章  大模型預訓練數據
  5.1  數據來源
    5.1.1  通用數據
    5.1.2  專業數據
  5.2  數據處理
    5.2.1  質量過濾
    5.2.2  冗余去除
    5.2.3  隱私消除
    5.2.4  詞元切分
  5.3  數據影響分析
    5.3.1  數據規模
    5.3.2  數據質量
  5.4  典型的開源數據集
    5.4.1  Pile數據集
    5.4.2  ROOTS數據集
  5.5  訓練集、驗證集、測試集的異同
    5.5.1  訓練、驗證與測試數據集的不同之處

    5.5.2  訓練、驗證與測試數據集的相似之處
  5.6  數據集面臨的挑戰
    5.6.1  規模和質量待提升
    5.6.2  大模型與數據集相輔相成
    5.6.3  標準規範需健全
    5.6.4  存儲性能待提高
  【作業】
  【實踐與思考】熟悉Globe Explorer智能搜索引擎
第6章  大模型開發組織
  6.1  大模型開發流程
  6.2  大模型的數據組織
    6.2.1  數據採集
    6.2.2  數據清洗和預處理
    6.2.3  數據標注
    6.2.4  數據集劃分
    6.2.5  模型設計
    6.2.6  模型初始化
    6.2.7  模型訓練
    6.2.8  模型驗證
    6.2.9  模型保存
    6.2.10  模型測試
    6.2.11  模型部署
  6.3  分而治之的思想
    6.3.1  分散式計算
    6.3.2  消息傳遞介面(MPI)
    6.3.3  MapReduce模型
    6.3.4  批處理和流處理
  6.4  分散式訓練與策略
    6.4.1  什麼是分散式訓練
    6.4.2  數據並行性
    6.4.3  模型並行性
    6.4.4  流水線並行性
    6.4.5  混合併行
    6.4.6  分散式訓練集群架構
  【作業】
  【實踐與思考】熟悉科大訊飛大模型「訊飛星火認知」
第7章  提示工程與微調
  7.1  什麼是提示工程
    7.1.1  提示工程的原理
    7.1.2  提示工程應用技術
    7.1.3  提示的通用技巧
  7.2  大模型為什麼要微調
  7.3  提示學習和語境學習
    7.3.1  提示學習
    7.3.2  語境學習
  7.4  上下文窗口擴展
  7.5  指令數據的構建
    7.5.1  手動構建指令
    7.5.2  自動構建指令
    7.5.3  開源指令數據集

  7.6  微調及其PEFT流行方案
    7.6.1  微調技術路線
    7.6.2  提示微調
    7.6.3  前綴微調
    7.6.4  LoRA
    7.6.5  QLoRA
  【作業】
  【實踐與思考】文生圖:註冊使用Midjourney繪圖工具
第8章  強化學習方法
  8.1  強化學習的概念
    8.1.1  強化學習的定義
    8.1.2  不同於監督和無監督學習
    8.1.3  不同於傳統機器學習
    8.1.4  大模型的強化學習
    8.1.5  先驗知識與標注數據
  8.2  強化學習基礎
    8.2.1  基於模型與免模型環境
    8.2.2  探索與利用
    8.2.3  片段還是連續任務
    8.2.4  網路模型設計
  8.3  強化學習分類
    8.3.1  從獎勵中學習
    8.3.2  被動與主動強化學習
    8.3.3  學徒學習
  8.4  深度強化學習
  【作業】
  【實踐與思考】熟悉文生視頻大模型Sora
第9章  大模型智能體
  9.1  智能體和環境
  9.2  智能體的良好行為
    9.2.1  性能度量
    9.2.2  理性
  9.3  環境的本質
    9.3.1  指定任務環境
    9.3.2  任務環境的屬性
  9.4  智能體的結構
    9.4.1  智能體程序
    9.4.2  學習型智能體
    9.4.3  智能體組件的工作
  9.5  構建大模型智能體
  9.6  人工智慧內容生成(AIGC)
    9.6.1  內容孿生
    9.6.2  內容編輯
  【作業】
  【實踐與思考】人形機器人創業獨角獸Figure AI
第10章  大模型應用框架
  10.1  大模型哲學問題
    10.1.1  組成性
    10.1.2  天賦論與語言習得
    10.1.3  語言理解與基礎

    10.1.4  世界模型
    10.1.5  知識傳遞和語言支持
  10.2  大模型應用流程
    10.2.1  確定需求大小
    10.2.2  數據收集
    10.2.3  數據集預處理
    10.2.4  大模型預訓練
    10.2.5  任務微調
    10.2.6  部署
  10.3  大模型應用場景
    10.3.1  機器翻譯、文本理解與分析
    10.3.2  自然語言生成
    10.3.3  搜索與知識提取
    10.3.4  代碼開發
    10.3.5  檢測和預防網路攻擊
    10.3.6  虛擬助理和客戶支持
    10.3.7  SEO關鍵詞優化
  10.4  案例:Magic突破Q演算法
  【作業】
  【實踐與思考】精通垃圾分類的ZenRobotics機器人
第11章  技術倫理與限制
  11.1  人工智慧面臨的倫理挑戰
    11.1.1  人工智慧與人類的關係
    11.1.2  人與智能機器的溝通
  11.2  數據隱私保護對策
    11.2.1  數據主權和數據權問題
    11.2.2  數據利用失衡問題
    11.2.3  構建隱私保護倫理準則
    11.2.4  健全道德倫理約束機制
  11.3  人工智慧倫理原則
    11.3.1  職業倫理準則的目標
    11.3.2  創新發展道德倫理宣言
    11.3.3  歐盟可信賴的倫理準則
  11.4  大模型的知識產權保護
    11.4.1  大模型的訴訟案例
    11.4.2  大模型生成內容的知識產權保護
    11.4.3  尊重隱私,保障安全,促進開放
    11.4.4  邊緣群體的數字平等
  【作業】
  【實踐與思考】完全由人工智慧完成的視覺藝術品無法獲得版權
第12章  大模型產品評估
  12.1  模型評估概述
  12.2  大模型評估體系
    12.2.1  知識與能力
    12.2.2  倫理與安全
    12.2.3  垂直領域評估
  12.3  大模型評估實踐
    12.3.1  基礎模型評估
    12.3.2  學習模型評估
  12.4  大模型產品對比

  12.5  大模型的大趨勢
  【作業】
  【實踐與思考】大模型橫向對比測試實踐
附錄A  作業參考答案
附錄B  課程學習與實踐總結
參考文獻

  • 商品搜索:
  • | 高級搜索
首頁新手上路客服中心關於我們聯絡我們Top↑
Copyrightc 1999~2008 美商天龍國際圖書股份有限公司 臺灣分公司. All rights reserved.
營業地址:臺北市中正區重慶南路一段103號1F 105號1F-2F
讀者服務部電話:02-2381-2033 02-2381-1863 時間:週一-週五 10:00-17:00
 服務信箱:bookuu@69book.com 客戶、意見信箱:cs@69book.com
ICP證:浙B2-20060032