幫助中心 | 我的帳號 | 關於我們

大模型RAG應用開發(構建智能生成系統)

  • 作者:凌峰|責編:王金柱
  • 出版社:清華大學
  • ISBN:9787302685982
  • 出版日期:2025/04/01
  • 裝幀:平裝
  • 頁數:274
人民幣:RMB 99 元      售價:
放入購物車
加入收藏夾

內容大鋼
    本書系統介紹檢索增強生成(RAG)技術的核心概念、開發流程和實際應用。本書共分為11章,第1?3章詳細介紹RAG開發的基礎,包括環境搭建、常用工具和模塊,幫助讀者從零開始理解RAG系統的工作原理與開發技巧:第4?8章聚焦RAG系統的具體搭建,從向量資料庫的創建、文本的向量化,到如何構建高效的檢索增強模型,為開發RAG應用奠定基礎;第9?11章通過實際案例,包括企業文檔問答系統、醫療文獻檢索系統和法律法規查詢助手的實際開發,幫助讀者在特定領域深入理解和應用RAG技術。
    本書適合RAG技術初學者、大模型和AI研發人員、數據分析和挖掘工程師,以及高年級本科生和研究生閱讀,也可作為培訓機構和高校相關課程的教學用書或參考書。

作者介紹
凌峰|責編:王金柱
    凌峰,畢業於中國科學院大學,博士,高級職稱,從事機器學習、人工智慧、圖像處理、計算視覺的研究與開發工作多年,擁有豐富的機器學習演算法實現經驗。

目錄
第1章  搭建RAG開發環境
  1.1  Python開發環境搭建
    1.1.1  虛擬環境的創建管理
    1.1.2  IDE的選擇與工作流的搭建
    1.1.3  依賴庫安裝與版本管理
  1.2  RAG開發中常用的Python依賴庫
    1.2.1  數據處理必備庫:Pandas與NumPy
    1.2.2  自然語言處理工具:NLTK與spaCy
    1.2.3  向量檢索與模型處理:FAISS與Transformers庫簡介
  1.3  RAG開發中常用的外部模塊
    1.3.1  數據採集與預處理:Requests與BeautifulSoup
    1.3.2  並行與非同步處理:Multiprocessing與Asyncio
  1.4  RAG與智能體
    1.4.1  智能體的基本定義與作用
    1.4.2  智能體的類型:反應型、認知型與學習型
  1.5  基於RAG的智能體開發基礎
    1.5.1  開發環境與工具
    1.5.2  智能體開發中的關鍵演算法:搜索、優化與規劃
    1.5.3  智能體的性能評估與調試方法
  1.6  本章小結
  1.7  思考題
第2章  傳統生成與檢索增強生成
  2.1  生成式AI和RAG的基本概念
    2.1.1  生成式AI的核心原理與工作機制
    2.1.2  生成檢索結合
    2.1.3  檢索增強與傳統生成模型的區別
  2.2  為何需要對傳統大模型進行檢索增強
    2.2.1  預訓練大模型的瓶頸
    2.2.2  RAG在實時信息處理中的優勢
  2.3  檢索增強核心:預訓練大模型
    2.3.1  Transformer架構的崛起:語言模型背後的核心引擎
    2.3.2  從BERT到GPT-4:大模型發展的重要里程碑
  2.4  本章小結
  2.5  思考題
第3章  RAG模型的工作原理
  3.1  檢索模塊與生成模塊
    3.1.1  檢索模塊的核心功能與數據流
    3.1.2  生成模塊在內容創建中的作用
    3.1.3  檢索與生成的協同工作機制
  3.2  向量檢索:將文本轉換為向量
    3.2.1  文本嵌入的基本原理與技術
    3.2.2  高效向量檢索:從相似度到索引優化
    3.2.3  向量檢索在RAG中的實際應用
  3.3  RAG開發中常用的生成模型簡介
    3.3.1  GPT家族:從GPT-2到GPT-4的演進
    3.3.2  BERT與T5:理解與生成的跨模型應用
  3.4  本章小結
  3.5  思考題
第4章  搭建一個簡單的RAG系統
  4.1  創建小型向量資料庫

    4.1.1  數據準備與預處理:搭建資料庫的第一步
    4.1.2  嵌入生成與存儲:從文本到向量的轉換
    4.1.3  使用FAISS構建檢索索引:實現高效查詢
  4.2  利用公開模型實現簡單的問答系統
    4.2.1  載入預訓練模型:選擇合適的生成模型
    4.2.2  檢索與生成模塊的集成:構建問答流程
    4.2.3  測試與優化:提升回答的準確性和一致性
  4.3  本章小結
  4.4  思考題
第5章  數據向量化與FAISS開發
  5.1  什麼是向量檢索:原理與常用演算法
    5.1.1  向量檢索的基本概念:從相似性到距離度量
    5.1.2  常用的向量檢索演算法:線性搜索與近似最近鄰
    5.1.3  向量檢索在RAG中的應用:增強上下文匹配
  5.2  使用FAISS構建高效的向量檢索系統
    5.2.1  FAISS索引結構解析:平面索引、倒排索引與產品量化
    5.2.2  構建和訓練FAISS索引:提高檢索速度和準確性
    5.2.3  FAISS在大規模數據中的優化策略:多級索引與分片
  5.3  數據的向量化:Embedding的生成
    5.3.1  嵌入生成模型選擇:如何匹配檢索任務需求
    5.3.2  文本嵌入的生成與存儲:從編碼到持久化
  5.4  本章小結
  5.5  思考題
第6章  文本檢索增強與上下文構建
  6.1  如何讓生成模型「理解」檢索到的內容
    6.1.1  檢索與生成的無縫銜接:內容重構與語義理解
    6.1.2  語義相似度與匹配:提升生成的準確性
    6.1.3  從檢索到生成的優化路徑:模型理解的增強
  6.2  上下文的構建與傳遞
    6.2.1  構建有效的上下文:信息篩選與組織策略
    6.2.2  多步上下文傳遞:保持生成內容的連貫性
    6.2.3  上下文優化技巧:減少冗余與增加相關性
  6.3  多輪對話與複雜生成任務的實現
    6.3.1  多輪交互的構建:讓生成模型模擬人類對話
    6.3.2  長對話與上下文管理:模型記憶的實現方法
    6.3.3  複雜生成任務分解:如何逐步實現多步驟生成
  6.4  本章小結
  6.5  思考題
第7章  構建檢索向量資料庫
  7.1  數據的準備與清洗
    7.1.1  數據質量提升:數據清洗與規範化流程
    7.1.2  數據標注與分類:構建高效檢索的基礎
  7.2  如何創建和管理向量資料庫
    7.2.1  向量資料庫的構建步驟:從嵌入到存儲
    7.2.2  高效管理:向量索引與檢索優化
  7.3  本章小結
  7.4  思考題
第8章  針對延遲與緩存的模型性能調優
  8.1  調整生成與檢索模塊的協同參數
    8.1.1  生成與檢索的平衡:優化參數的核心原則

    8.1.2  動態參數調節:提升響應質量與精度
  8.2  縮短RAG系統的響應時間
    8.2.1  延遲分析與瓶頸定位:加速響應的第一步
    8.2.2  緩存與並行處理策略:實現高效RAG系統
  8.3  本章小結
  8.4  思考題
第9章  企業文檔問答系統的開發
  9.1  需求分析與系統設計
    9.1.1  確定問答系統的需求:識別用戶的主要查詢類型與目標
    9.1.2  系統結構與模塊劃分:明確檢索與生成模塊的協作方式
  9.2  搭建向量資料庫與檢索模塊
    9.2.1  數據預處理與向量化:生成高效的嵌入向量
    9.2.2  構建與優化索引:提升檢索模塊的查詢速度
  9.3  生成模塊的集成與模型調優
    9.3.1  載入與配置生成模型:選擇適合問答系統的生成模型
    9.3.2  模型優化與提示詞調優:提高生成內容的準確性與相關性
  9.4  系統測試、部署與優化
    9.4.1  測試流程與性能監控:確保系統的穩定性與響應速度
    9.4.2  企業環境的部署與上線:實現系統在實際業務中的應用
  9.5  本章小結
  9.6  思考題
第10章  醫療文獻檢索與分析系統的開發
  10.1  需求分析與數據準備
    10.1.1  確定醫學文獻檢索需求:識別用戶查詢重點
    10.1.2  數據收集與清洗:構建高質量的醫學知識庫
  10.2  構建高效的檢索模塊
    10.2.1  設計向量檢索系統:提升檢索效率
    10.2.2  優化索引結構:加速醫學文獻的精確匹配
  10.3  生成模塊開發、集成和調優
    10.3.1  生成模型與檢索的集成:精準回答用戶提問
    10.3.2  生成內容的優化與提示詞調優:提升回答的質量與專業性
  10.4  本章小結
  10.5  思考題
第11章  法律法規查詢助手的開發
  11.1  需求分析與數據收集
    11.1.1  用戶需求解析:明確法律法規查詢的主要需求
    11.1.2  法律法規數據源與收集方法:搭建全面的法規資料庫
    11.1.3  數據清洗與標準化:提升查詢效率和準確性
  11.2  法律法規檢索模塊的實現
    11.2.1  向量化法律條款:構建檢索友好的嵌入
    11.2.2  FAISS索引在法規查詢中的應用:提升檢索性能
    11.2.3  優化檢索流程:提高法律條款的匹配精度
  11.3  生成模塊開發與輸出優化
    11.3.1  生成模型與檢索模塊的集成:構建準確的法規回答
    11.3.2  輸出格式與內容優化:提供清晰的法律解釋
    11.3.3  提示詞調優與模型配置:確保法律回答的專業性
  11.4  本章小結
  11.5  思考題

  • 商品搜索:
  • | 高級搜索
首頁新手上路客服中心關於我們聯絡我們Top↑
Copyrightc 1999~2008 美商天龍國際圖書股份有限公司 臺灣分公司. All rights reserved.
營業地址:臺北市中正區重慶南路一段103號1F 105號1F-2F
讀者服務部電話:02-2381-2033 02-2381-1863 時間:週一-週五 10:00-17:00
 服務信箱:bookuu@69book.com 客戶、意見信箱:cs@69book.com
ICP證:浙B2-20060032