幫助中心 | 我的帳號 | 關於我們

快速部署大模型(ChatGPT嵌入式微調和多模態AI的策略與最佳實踐第2版)

  • 作者:(美)斯楠·奧茲德米爾|責編:王中英|譯者:馮磊//周慧梅
  • 出版社:清華大學
  • ISBN:9787302717188
  • 出版日期:2026/06/01
  • 裝幀:平裝
  • 頁數:294
人民幣:RMB 108 元      售價:
放入購物車
加入收藏夾

內容大鋼
    本書是大語言模型(LLM)領域的系統性實戰指南,由兼具理論數學背景與AI創業經驗的Sinan Ozdemir撰寫,旨在幫助讀者既理解LLM的底層原理,又能快速將其應用於實際項目。
    全書分為四大部分共12章。第一部分(第1?4章)從LLM基本概念出發,系統介紹Transformer架構、語義搜索、提示工程等基礎知識,並通過檢索增強生成(RAG)和AI智能體案例展示實際應用。第二部分(第5?8章)深入探討模型微調、高級提示工程、自定義嵌入與模型架構以及AI對齊原則,幫助讀者從「能用」邁向「用好」。第三部分(第9?12章)聚焦前沿實踐,涵蓋多模態模型、基於人類反饋的強化學習(RLHF)、開源模型高級微調、生產部署優化及LLM評估方法論。第四部分(附錄A?附錄D)提供常見問題解答、術語表和應用架構參考。
    本書最大的特色在於理論與實踐的深度結合——每個核心概念都配有直觀的類比解釋和可運行的Python代碼示例,讀者可跟隨實戰項目逐步掌握從原型到生產的完整技能鏈。適合有一定編程基礎的開發者、數據科學家及希望系統掌握LLM技術的AI從業者閱讀。

作者介紹
(美)斯楠·奧茲德米爾|責編:王中英|譯者:馮磊//周慧梅

目錄
第一部分 大語言模型導論
  第1章 大語言模型概述
    1.1 什麼是大語言模型
      LLM的定義
    1.2 流行的現代LLM
      1.2.1 BERT
      1.2.2 GPT家族與ChatGPT
      1.2.3 T5
      1.2.4 Llama
    1.3 LLM的關鍵特徵
    1.4 理解上下文的重要性
    1.5 LLM的工作原理
      1.5.1 預訓練階段
      1.5.2 遷移學習
      1.5.3 微調
      1.5.4 注意力
      1.5.5 嵌入
      1.5.6 標記化
      1.5.7 超越語言建模:模型對齊與基於人類反饋的強化學習
      1.5.8 領域特定大語言模型
    1.6 LLM的應用
      1.6.1 經典NLP任務
      1.6.2 自由文本生成
      1.6.3 信息檢索/神經語義搜索
      1.6.4 聊天機器人
    1.7 總結
  第2章 使用LLM進行語義搜索
    2.1 引言
    2.2 任務背景
      非對稱語義搜索
    2.3 解決方案概覽
    2.4 核心組件
      2.4.1 文本嵌入器
      2.4.2 如何判斷文本片段的「相似性」
      2.4.3 文檔分塊
      2.4.4 向量資料庫
      2.4.5 重新排序檢索結果
      2.4.6 API
    2.5 整合全局:讓一切運轉起來
      性能評估
    2.6 閉源組件的成本
    2.7 總結
  第3章 提示工程入門
    3.1 引言
    3.2 提示工程
      3.2.1 語言模型中的對齊
      3.2.2 直接詢問
      3.2.3 當「直接詢問」不再奏效
      3.2.4 少樣本學習
      3.2.5 輸出格式化

      3.2.6 人設提示
      3.2.7 思維鏈提示
      3.2.8 示例:基礎算術
    3.3 跨模型使用提示
      3.3.1 聊天模型補全模型
      3.3.2 Cohere的Command系列
      3.3.3 開源模型的提示工程
    3.4 總結
  第4章 AI生態系統:整合各個組件
    4.1 引言
    4.2 閉源AI的性能漂移
    4.3 AI的推理與思考之別
    4.4 案例研究1:檢索增強生成(RAG)
      4.4.1 組件協作:檢索器與生成器
      4.4.2 評估RAG系統
    4.5 案例研究2:自動化AI智能體
      4.5.1 思考→行動→觀察→響應
      4.5.2 評估AI智能體
    4.6 總結
第二部分 充分發揮LLM的價值
  第5章 利用定製微調優化LLM
    5.1 引言
    5.2 遷移學習與微調:入門指南
      5.2.1 微調流程詳解
      5.2.2 以閉源預訓練模型為基礎
    5.3 OpenAI微調API一覽
      5.3.1 OpenAI微調API
      5.3.2 案例研究:應用評論情感分類
      5.3.3 數據準則和最佳實踐
    5.4 使用OpenAI CLI準備自定義示例
    5.5 設置OpenAI CLI
      超參數選擇與優化
    5.6 我們的第一個微調LLM
      5.6.1 使用定量指標評估微調模型
      5.6.2 定性評估技術
      5.6.3 將微調后的OpenAI模型集成到應用中
      5.6.4 OpenAI對決開源自編碼BERT
    5.7 總結
  第6章 高級提示工程
    6.1 引言
    6.2 提示注入攻擊
    6.3 輸入/輸出驗證
      示例:使用NLI構建驗證管道
    6.4 批量提示
    6.5 提示鏈
      6.5.1 使用提示鏈防止提示堆砌
      6.5.2 示例:使用多模態LLM進行安全鏈式操作
    6.6 案例研究:AI的數學有多好
      6.6.1 我們的數據集:MathQA
      6.6.2 展示你的計算過程?測試思維鏈

      6.6.3 用少樣本示例鼓勵LLM
      6.6.4 示例重要嗎?重訪語義搜索
      6.6.5 總結MathQA數據集的結果
    6.7 總結
  第7章 定製嵌入與模型架構
    7.1 引言
    7.2 案例研究:構建推薦系統
      7.2.1 設置問題和數據
      7.2.2 定義推薦問題
      7.2.3 推薦系統的宏觀視角
      7.2.4 生成自定義描述欄位以比較物品
      7.2.5 使用基礎嵌入設定基線
      7.2.6 準備微調數據
      7.2.7 結果總結
    7.3 總結
  第8章 AI對齊的第一性原理
    8.1 引言
    8.2 對齊的對象與目的
      8.2.1 指令對齊
      8.2.2 行為對齊
      8.2.3 風格對齊
      8.2.4 價值對齊
    8.3 對齊作為偏見緩解器
    8.4 對齊的三大支柱
      8.4.1 數據
      8.4.2 訓練/調優模型
      8.4.3 評估
      8.4.4 對齊的三大支柱小結
    8.5 憲法式AI:邁向自我對齊的一步
    8.6 總結
第三部分 LLM高級應用
  第9章 超越基礎模型
    9.1 引言
    9.2 案例研究:視覺問答
      9.2.1 模型介紹:Vision Transformer、GPT-2和DistilBERT
      9.2.2 隱藏狀態投影與融合
      9.2.3 交叉注意力:它是什麼?為什麼如此關鍵
      9.2.4 我們的自定義多模態模型
      9.2.5 我們的數據:Visual QA
      9.2.6 VQA訓練循環
      9.2.7 結果總結
    9.3 案例研究:基於反饋的強化學習
      9.3.1 我們的模型:FLAN-T5
      9.3.2 我們的獎勵模型:情感與語法正確性
      9.3.3 Transformer強化學習
      9.3.4 RLF訓練循環
      9.3.5 結果總結
    9.4 總結
  第10章 高級開源LLM微調
    10.1 引言

    10.2 示例:使用BERT進行動漫流派多標籤分類
      10.2.1 使用Jaccard分數衡量動漫標題多標籤流派預測的性能
      10.2.2 一個簡單的微調循環
      10.2.3 微調開源LLM的通用技巧
      10.2.4 結果總結
    10.3 示例:使用GPT2生成LaTeX
      10.3.1 開源模型的提示工程
      10.3.2 結果總結
    10.4 打造自己的睿智且引人入勝的對話助手——SAWYER
      10.4.1 步驟1:監督指令微調
      10.4.2 步驟2:獎勵模型訓練
      10.4.3 步驟3:基於(模擬的)人類反饋的強化學習
      10.4.4 結果總結
      10.4.5 用新鮮知識更新我們的LLM
    10.5 總結
  第11章 將LLM投入生產
    11.1 引言
    11.2 閉源LLM的生產部署
      11.2.1 成本預估
      11.2.2 API密鑰管理
    11.3 開源LLM的生產部署
      11.3.1 為推理準備模型
      11.3.2 互操作性
      11.3.3 量化
      11.3.4 知識蒸餾
      11.3.5 LLM的成本預估
      11.3.6 發布到Hugging Face
    11.4 總結
  第12章 評估LLM
    12.1 引言
    12.2 評估生成任務
      12.2.1 生成式多項選擇
      12.2.2 自由文本回答
      12.2.3 基準測試
    12.3 評估理解任務
      12.3.1 嵌入
      12.3.2 校準分類
      12.3.3 探測LLM的世界模型
    12.4 總結
    12.5 繼續前行
第四部分 附錄
  附錄A LLM常見問題解答
  附錄B LLM術語表
  附錄C LLM應用原型
  附錄D 代碼庫使用指南

  • 商品搜索:
  • | 高級搜索
首頁新手上路客服中心關於我們聯絡我們Top↑
Copyrightc 1999~2008 美商天龍國際圖書股份有限公司 臺灣分公司. All rights reserved.
營業地址:臺北市中正區重慶南路一段103號1F 105號1F-2F
讀者服務部電話:02-2381-2033 02-2381-1863 時間:週一-週五 10:00-17:00
 服務信箱:bookuu@69book.com 客戶、意見信箱:cs@69book.com
ICP證:浙B2-20060032