幫助中心 | 我的帳號 | 關於我們

RAG實踐權威指南(構建精準高效大模型之道)/智能系統與技術叢書

  • 作者:寧星星|責編:高婧雅
  • 出版社:機械工業
  • ISBN:9787111781790
  • 出版日期:2025/06/01
  • 裝幀:平裝
  • 頁數:255
人民幣:RMB 89 元      售價:
放入購物車
加入收藏夾

內容大鋼
    本書由華大生命科學研究院資深NLP專家撰寫,旨在帶你從零構建高效的企業級RAG系統。本書全面解析RAG原理與實戰,涵蓋架構與組件、高階技術與實踐、檢索與問答模塊優化策略、模型推理等核心技術,並深入講解三大落地優化技術,以及高階變體與能力增強措施。
    本書共8章。第1章介紹RAG技術基礎,幫助讀者建立對RAG技術的全面認知。第2章介紹RAG系統的核心組件與實踐,幫助讀者掌握核心技術與基於Python庫的實踐。第3章介紹高階RAG技術與實踐的細節,幫助讀者掌握進階技術。第4章介紹檢索與問答模塊的優化,全方位講解優化策略。第5章介紹模型推理技術,加速RAG技術的落地。第6章介紹RAG系統在實際應用中的魯棒性、安全性和公平性優化技術,提升RAG系統的整體性能與可信度。第7章介紹RAG技術的高階變體,以充分挖掘RAG技術的應用潛力。第8章介紹實時知識更新與跨模態能力增強,展望RAG技術未來應用的方向。

作者介紹
寧星星|責編:高婧雅
    寧星星,華大生命科學研究院(BGI)生物智能研究所資深NLP演算法工程師,目前從事RAG系統、Agent智能系統、生命科學垂直領域大模型等相關研發工作。擁有多年NLP演算法相關開發經驗,擅長大模型、AIGC、智能問答等相關技術,並多次獲得全國性NLP與知識圖譜相關競賽獎項。著有《語義解析:自然語言生成SQL與知識圖譜問答實戰》一書。

目錄
前言
第1章  RAG技術基礎
  1.1  為什麼需要RAG技術
  1.2  工作流程與核心技術解析
    1.2.1  工作流程
    1.2.2  核心技術
  1.3  工作範式
  1.4  價值與實際應用場景
  1.5  計算資源與數據存儲需求
    1.5.1  計算資源的需求
    1.5.2  數據存儲的需求
  1.6  面臨的主要挑戰
第2章  RAG系統的核心組件與實踐
  2.1  向量資料庫
    2.1.1  Elasticsearch
    2.1.2  FAISS
    2.1.3  Milvus
  2.2  檢索系統
    2.2.1  基於知識圖譜查詢
    2.2.2  基於關係型資料庫查詢
    2.2.3  基於向量資料庫查詢
  2.3  生成系統
    2.3.1  Transformer
    2.3.2  GPT
  2.4  RAG系統基準測試工具
    2.4.1  評測數據集
    2.4.2  常用的評測基準與步驟
  2.5  基於常用Python庫的RAG實踐
    2.5.1  基於Hugging Face Transformers庫
    2.5.2  基於PyTorch和TensorFlow
    2.5.3  基於LlamaIndex
    2.5.4  基於LangChain
第3章  高階RAG技術與實踐
  3.1  切片與向量化技術
    3.1.1  切片
    3.1.2  向量化
    3.1.3  向量存儲與檢索
    3.1.4  優化切片與向量化策略
    3.1.5  實戰:從文本到向量
  3.2  檢索技術
    3.2.1  檢索流程及優化策略
    3.2.2  關鍵詞檢索
    3.2.3  語義檢索
    3.2.4  密集段落檢索
    3.2.5  混合檢索
    3.2.6  重排序
  3.3  高級檢索策略
    3.3.1  假設性問題和假設性回答策略
    3.3.2  擴大檢索語境
  3.4  生成模型的選型與提示詞工程

  3.5  檢索技術與生成技術的融合
    3.5.1  RAG-Token模型
    3.5.2  RAG-Sequence模型
第4章  檢索與問答模塊優化
  4.1  數據預處理和管理優化
    4.1.1  數據清洗
    4.1.2  數據存儲和訪問優化
  4.2  檢索模塊的優化
    4.2.1  嵌入模型的訓練優化
    4.2.2  文檔解析技術的優化
    4.2.3  同義詞擴展
    4.2.4  查詢重寫
  4.3  問答模塊的優化
    4.3.1  問答能力的優化
    4.3.2  增強拒答能力
第5章  模型推理優化
  5.1  推理加速技術
    5.1.1  量化
    5.1.2  剪枝
    5.1.3  知識蒸餾
  5.2  分散式推理
    5.2.1  分散式推理技術
    5.2.2  分散式推理演算法
    5.2.3  常見的分散式推理系統
    5.2.4  分散式推理優化策略
  5.3  邊緣計算優化
第6章  魯棒性、安全性和公平性優化
  6.1  模型魯棒性優化
    6.1.1  對抗訓練
    6.1.2  模型正則化
    6.1.3  隨機自我集成
    6.1.4  防禦模塊
  6.2  模型安全性優化
    6.2.1  數據匿名化和加密
    6.2.2  訪問控制
    6.2.3  驗證查詢和輸出內容
    6.2.4  保護向量資料庫
  6.3  模型公平性優化
    6.3.1  檢測模型偏見的方法
    6.3.2  減少模型偏見的策略
第7章  RAG技術的高階變體
  7.1  長上下文的困境突圍LongRAG
    7.1.1  原理解析
    7.1.2  源碼解析:LongRAG的深度剖析
  7.2  知識圖譜的優勢融合GraphRAG
    7.2.1  原理解析
    7.2.2  源碼解析:GraphRAG的深度剖析
  7.3  垂直領域的定向增強GeneRAG
    7.3.1  原理解析
    7.3.2  源碼解析:GeneRAG的深度剖析

第8章  實時知識更新與跨模態能力增強
  8.1  實時知識更新
    8.1.1  數據實時獲取的方法
    8.1.2  知識庫動態更新
    8.1.3  自動化數據管道
  8.2  跨模態能力增強
    8.2.1  多模態向量嵌入
    8.2.2  多模態內容生成
附錄  相似度計算

  • 商品搜索:
  • | 高級搜索
首頁新手上路客服中心關於我們聯絡我們Top↑
Copyrightc 1999~2008 美商天龍國際圖書股份有限公司 臺灣分公司. All rights reserved.
營業地址:臺北市中正區重慶南路一段103號1F 105號1F-2F
讀者服務部電話:02-2381-2033 02-2381-1863 時間:週一-週五 10:00-17:00
 服務信箱:bookuu@69book.com 客戶、意見信箱:cs@69book.com
ICP證:浙B2-20060032