幫助中心 | 我的帳號 | 關於我們

大型語言模型實戰指南(應用實踐與場景落地)/智能系統與技術叢書

  • 作者:劉聰//沈盛宇//李特麗//杜振東|責編:楊福川//陳潔
  • 出版社:機械工業
  • ISBN:9787111758457
  • 出版日期:2024/08/01
  • 裝幀:平裝
  • 頁數:277
人民幣:RMB 99 元      售價:
放入購物車
加入收藏夾

內容大鋼
    這是一本系統梳理並深入解析大模型的基礎理論、演算法實現、數據構造流程、模型微調方法、偏好對齊方法的著作,也是一本能手把手教你構建角色扮演、信息抽取、知識問答、AI Agent等各種強大的應用程序的著作。本書得到了零一萬物、面壁智能、通義千問、百姓AI、瀾舟科技等國內主流大模型團隊的負責人的高度評價和鼎力推薦。
    具體地,通過本書你能了解或掌握以下知識:
    (1)大型語言模型的基礎理論,包括常見的模型架構、領域大型語言模型以及如何評估大模型的性能。
    (2)大模型微調的關鍵步驟:從數據的收集、清洗到篩選,直至微調訓練的技術細節。
    (3)大模型人類偏好對齊方法,從基於人工反饋的強化學習框架到當前主流的對齊方法。
    (4)通過GPTs快速搭建個性化的專屬ChatGPT應用。
    (5)通過開源模型在多種場景下搭建大模型應用,包括:表格查詢、角色扮演、信息抽取、知識問答、AI Agent等。
    (6)掌握大模型Agent方法以及Agent常用框架。
    (7)基於LangChain框架構建一個AutoGPT應用。
    本書集大模型理論、實踐和場景落地于一體,提供大量經詳細註釋的代碼,方便讀者理解和實操。總之,不管里是想深入研究大模型本身,還是進行大模型相關應用搭建,本書都應該能給你頗具價值的技術啟發與思考,讓你在大模型的路上快速前行,少走彎路。

作者介紹
劉聰//沈盛宇//李特麗//杜振東|責編:楊福川//陳潔

目錄
前言
第1章  大型語言模型基礎
  1.1  Transformer基礎
  1.2  常用的大型語言模型
    1.2.1  GPT系列模型
    1.2.2  OPT模型
    1.2.3  Bloom模型
    1.2.4  GLM系列模型
    1.2.5  LLaMA系列模型
    1.2.6  Baichuan系列模型
    1.2.7  Qwen系列模型
    1.2.8  Skywork模型
  1.3  領域大型語言模型
    1.3.1  法律大型語言模型
    1.3.2  醫療大型語言模型
    1.3.3  金融大型語言模型
    1.3.4  教育大型語言模型
  1.4  大型語言模型評估
    1.4.1  大型語言模型的評估內容
    1.4.2  大型語言模型的評估方法
    1.4.3  大型語言模型評估榜單
  1.5  本章小結
第2章  大型語言模型的常用微調方法
  2.1  數據構造與清洗
    2.1.1  數據構造方法
    2.1.2  數據清洗方法
  2.2  分詞器構造
    2.2.1  分詞器概述
    2.2.2  BPE分詞器
    2.2.3  WordPiece分詞器
    2.2.4  Unigram分詞器
    2.2.5  SentencePiece分詞器
    2.2.6  詞表融合
  2.3  大型語言模型的微調方法
    2.3.1  前綴調優
    2.3.2  提示調優
    2.3.3  P-Tuning v2
    2.3.4  LoRA
    2.3.5  DyLoRA
    2.3.6  AdaLoRA
    2.3.7  QLoRA
    2.3.8  QA-LoRA
    2.3.9  LongLoRA
    2.3.10  VeRA
    2.3.11  S-LoRA
  2.4  基於PEFT的LLaMA模型微調實戰
    2.4.1  項目介紹
    2.4.2  數據預處理
    2.4.3  模型微調
    2.4.4  模型預測

  2.5  本章小結
第3章  大型語言模型的人類偏好對齊
  3.1  基於人類反饋的強化學習框架
  3.2  前沿偏好對齊方法
    3.2.1  RRHF
    3.2.2  RLAIF
    3.2.3  DPO
    3.2.4  APO
  3.3  基於DPO的偏好對齊實戰
    3.3.1  數據集介紹
    3.3.2  TRL框架介紹
    3.3.3  訓練代碼解析
  3.4  本章小結
第4章  創建個人專屬的ChatGPT——GPTs
  4.1  GPTs初體驗
  4.2  GPTs的初階使用
    4.2.1  知識庫的使用
    4.2.2  內置插件的使用
    4.2.3  知識庫與內置插件的結合使用
  4.3  GPTs的高階使用
  4.4  本章小結
第5章  大型語言模型SQL任務實戰
  5.1  公開數據集
    5.1.1  英文公開數據集
    5.1.2  中文公開數據集
  5.2  主流方法
    5.2.1  基於規則的方法
    5.2.2  基於深度學習的方法
    5.2.3  基於預訓練語言模型的方法
    5.2.4  基於大型語言模型的方法
  5.3  Text2SQL任務實戰
    5.3.1  項目介紹
    5.3.2  數據預處理
    5.3.3  模型微調
    5.3.4  模型預測
  5.4  本章小結
第6章  大型語言模型的角色扮演應用
  6.1  角色扮演
    6.1.1  大型語言模型如何進行角色扮演
    6.1.2  角色扮演數據的構造方法
    6.1.3  大型語言模型角色扮演的能力評估
  6.2  角色扮演實戰測試
  6.3  基於Baichuan的角色扮演模型微調
    6.3.1  項目介紹
    6.3.2  數據預處理
    6.3.3  模型微調
    6.3.4  模型預測
  6.4  本章小結
第7章  大型語言模型的對話要素抽取應用
  7.1  對話要素抽取

  7.2  對話要素抽取實戰測試
    7.2.1基於GPT-3.5API進行對話要素抽取
    7.2.2基於Qwen-1.8B模型進行對話要素抽取
  7.3  基於Qwen的對話要素抽取模型微調
    7.3.1  項目介紹
    7.3.2  數據預處理
    7.3.3  模型微調
    7.3.4  模型預測
  7.4  本章小結
第8章  Agent應用開發
  8.1  Agent概述
  8.2  Agent的主要模塊
  8.3  Agent的行為決策機制
  8.4  主流Agent框架
    8.4.1  LangChain框架
    8.4.2  LlamaIndex框架
    8.4.3  AutoGPT框架
    8.4.4  AutoGen框架
    8.4.5  SuperAGI框架
  8.5  本章小結
第9章  基於知識庫的大型語言模型問答應用
  9.1  基於知識庫問答
  9.2  向量資料庫
    9.2.1  文本的向量表徵
    9.2.2  向量的距離度量方法
    9.2.3  常用的向量資料庫
  9.3  基於知識庫的大型語言模型問答實戰
    9.3.1  BGE微調
    9.3.2  基於ChatGLM3知識庫答案生成任務的微調
    9.3.3  基於Streamlit的知識庫答案應用搭建
  9.4  本章小結
第10章  使用LangChain構建一個AutoGPT
  10.1  AutoGPT概述
  10.2  LangChain概述
  10.3  使用LangChain構建AutoGPT
    10.3.1  構建
    10.3.2  規劃和任務分解
    10.3.3  輸出解析
    10.3.4  程序的核心AutoGPT類
    10.3.5  工具能力配置
    10.3.6  為Agent配置記憶
  10.4  運行AutoGPT
  10.5  本章小結

  • 商品搜索:
  • | 高級搜索
首頁新手上路客服中心關於我們聯絡我們Top↑
Copyrightc 1999~2008 美商天龍國際圖書股份有限公司 臺灣分公司. All rights reserved.
營業地址:臺北市中正區重慶南路一段103號1F 105號1F-2F
讀者服務部電話:02-2381-2033 02-2381-1863 時間:週一-週五 10:00-17:00
 服務信箱:bookuu@69book.com 客戶、意見信箱:cs@69book.com
ICP證:浙B2-20060032