幫助中心 | 我的帳號 | 關於我們

艾博士(深入淺出大語言模型)

  • 作者:編者:馬少平|責編:楊帆
  • 出版社:清華大學
  • ISBN:9787302713630
  • 出版日期:2026/05/01
  • 裝幀:平裝
  • 頁數:231
人民幣:RMB 69 元      售價:
放入購物車
加入收藏夾

內容大鋼
    本書設計了博學的艾博士和好學的小明兩個人物,以師徒二人對話的方式,由淺入深地講解大語言模型相關內容的基本原理,講解詳細,通俗易懂,給讀者以在教室上課的真實感。本書首先對大語言模型中用到的數學基礎做了簡要介紹,以方便讀者學習;其次對神經網路與深度學習進行了詳細講解,這對於後續學習和理解大語言模型很有幫助;再次詳細講解Transformer架構;最後深入講解GPT、BERT等具體的模型,以及強化學習方法、PPO演算法和基於人類反饋的強化學習方法等。
    本書適合於對大語言模型感興趣的初學者、從事人工智慧相關研發的工程技術人員,以及講授相關課程的教師閱讀。

作者介紹
編者:馬少平|責編:楊帆
    馬少平,清華大學電腦系教授,博世知識表示與推理冠名教授,現任清華大學「天工」智能計算研究院常務副院長,人工智慧研究院信息獲取研究中心主任,中國人工智慧學會副監事長,中國中文信息學會副理事長,長期從事智能信息處理工作,在信息檢索、推薦系統方面取得了優秀成果。同時,馬少平教授從事人工智慧導論的教學工作長達20多年,在人工智慧教育領域有豐富經驗。

目錄
第1章  什麼是大語言模型
  1.1  大語言模型簡介
  1.2  大語言模型應用
  1.3  總結
第2章  預備知識
  2.1  矩陣和向量的基礎知識
    2.1.1  矩陣
    2.1.2  向量
  2.2  數學期望與方差
  2.3  馬爾可夫過程
  2.4  總結
第3章  神經元與神經網路
  3.1  從數字識別談起
  3.2  神經元
  3.3  神經網路
  3.4  反向傳播演算法
  3.5  卷積神經網路
  3.6  殘差神經網路
  3.7  詞向量
    3.7.1  詞的向量表示
    3.7.2  神經網路語言模型
    3.7.3  word2vec模型
  3.8  循環神經網路
  3.9  長短期記憶網路
  3.10  總結
第4章  Transformer模型
  4.1  序列到序列問題
  4.2  注意力機制
    4.2.1  什麼是注意力機制
    4.2.2  自注意力機制
    4.2.3  多頭注意力機制
  4.3  殘差連接
  4.4  層歸一化
  4.5  Transformer模型
    4.5.1  Transformer模型的編碼器
    4.5.2  Transformer模型的解碼器
    4.5.3  Transformer模型的訓練
    4.5.4  位置編碼
    4.5.5  層歸一化的位置
    4.5.6  詞元化方法
  4.6  總結
第5章  GPT模型
  5.1  預訓練模型
  5.2  GPT-1模型
    5.2.1  GPT-1模型的基本構成
    5.2.2  GPT-1預訓練過程
    5.2.3  GPT-1微調過程
    5.2.4  GPT-1模型的應用
    5.2.5  GPT-1性能分析
  5.3  GPT-2模型

    5.3.1  GPT-2模型的基本構成
    5.3.2  GPT-2性能評價
  5.4  GPT-3模型
    5.4.1  GPT-3模型的基本構成
    5.4.2  數據集
    5.4.3  語境學習
    5.4.4  語境學習性能評價
  5.5  ChatGPT模型
  5.6  總結
第6章  BERT模型
  6.1  BERT模型架構
  6.2  BERT模型的輸入
  6.3  BERT模型的預訓練方法
    6.3.1  MLM方法
    6.3.2  NSP方法
  6.4  BERT模型的微調方法
    6.4.1  句對分類任務
    6.4.2  單句分類任務
    6.4.3  文本問答任務
    6.4.4  單句標注任務
  6.5  總結
第7章  強化學習方法
  7.1  什麼是強化學習
  7.2  策略梯度方法
  7.3  演員-評論家方法
    7.3.1  策略梯度方法存在的問題
    7.3.2  優勢函數
    7.3.3  演員-評論家方法的實現
    7.3.4  廣義優勢估計
    7.3.5  評論家模型
  7.4  基於異策略的演員-評論家方法
    7.4.1  重要性採樣
    7.4.2  近端策略優化演算法
  7.5  總結
第8章  基於人類反饋的強化學習方法
  8.1  學習如何回答問題
  8.2  學習人類偏好
  8.3  按人類偏好優化模型
  8.4  總結
第9章  大語言模型的應用:提示工程
  9.1  應用準備
  9.2  提示詞寫作指南
  9.3  大語言模型應用舉例
  9.4  DeepSeek使用簡介
  9.5  總結

  • 商品搜索:
  • | 高級搜索
首頁新手上路客服中心關於我們聯絡我們Top↑
Copyrightc 1999~2008 美商天龍國際圖書股份有限公司 臺灣分公司. All rights reserved.
營業地址:臺北市中正區重慶南路一段103號1F 105號1F-2F
讀者服務部電話:02-2381-2033 02-2381-1863 時間:週一-週五 10:00-17:00
 服務信箱:bookuu@69book.com 客戶、意見信箱:cs@69book.com
ICP證:浙B2-20060032