幫助中心 | 我的帳號 | 關於我們

AI搜索(基礎與前沿)

  • 作者:鄒敏|責編:吳晉瑜
  • 出版社:人民郵電
  • ISBN:9787115575654
  • 出版日期:2025/08/01
  • 裝幀:平裝
  • 頁數:234
人民幣:RMB 119 元      售價:
放入購物車
加入收藏夾

內容大鋼
    本書系統介紹了搜索引擎的技術發展歷程和前沿趨勢,內容分為三大部分:搜索引擎基礎、深度信息檢索模型與演算法以及AI搜索前沿。第一部分涵蓋了搜索引擎的核心架構與關鍵技術,包括基本系統架構、查詢理解、索引技術、關鍵詞檢索、排序學習等內容,為讀者提供了現代搜索系統的技術框架和實踐參考。第二部分詳細探討了深度學習技術在信息檢索中的應用,包括深度召回模型、k近鄰檢索演算法、深度相關性模型、深度排序模型等,並通過案例展示了如何將這些技術應用於實際問題。第三部分則聚焦于AI搜索前沿技術,介紹了大語言模型基礎、AI搜索實踐、生成式信息檢索,探討了AI搜索時代的技術特點及未來發展方向。
    本書附有豐富的實踐案例和代碼示例,可以幫助讀者將理論知識付諸實踐,既適合想了解AI搜索相關內容的初學者學習,也適合AI搜索領域的相關從業者參考。

作者介紹
鄒敏|責編:吳晉瑜
    鄒敏,中國科學院數學研究所碩士,現任昆崙萬維集團大模型團隊演算法總監。曾於微軟必應(Bing)從事搜索引擎演算法的研發工作,後任美國Hulu公司搜索團隊負責人,作為資深研發經理主導了Disney與Hulu搜索系統的建設。長期專註于信息檢索、大模型與智能體技術領域,擁有4項發明專利。

目錄
第一部分  搜索引擎基礎
  第1章  搜索引擎的基本系統架構
    1.1  網頁抓取
      1.1.1  網頁抓取過程
      1.1.2  網頁抓取系統的組成部分
      1.1.3  爬蟲系統的衡量指標
    1.2  內容理解
      1.2.1  頁面分析
      1.2.2  網頁分類
    1.3  索引構建
      1.3.1  索引的數據源
      1.3.2  索引結構與壓縮演算法
      1.3.3  索引的分片、複本與分級策略
    1.4  查詢理解
      1.4.1  查詢詞預處理
      1.4.2  查詢改寫
      1.4.3  查詢擴展
      1.4.4  時效性分析
      1.4.5  查詢分類
    1.5  召回
      1.5.1  關鍵詞召回
      1.5.2  語義召回
    1.6  排序
      1.6.1  特徵工程
      1.6.2  排序模型
      1.6.3  多級排序框架
    1.7  其他
    1.8  小結
  第2章  查詢理解
    2.1  查詢語法與查詢解析
      2.1.1  基本查詢語法
      2.1.2  查詢解析
    2.2  查詢詞預處理
    2.3  拼寫糾錯
    2.4  詞權重計算
      2.4.1  詞權重模型
      2.4.2  詞權重模型訓練過程
      2.4.3  詞權重應用
      2.4.4  其他詞權重計算方法
    2.5  查詢分類
      2.5.1  垃圾查詢識別
      2.5.2  時效性查詢識別
    2.6  查詢擴展
      2.6.1  基於詞典的查詢擴展
      2.6.2  基於相關文檔的查詢擴展
      2.6.3  基於向量化表示的查詢擴展
      2.6.4  基於大語言模型的查詢擴展
    2.7  查詢改寫
      2.7.1  基於機器翻譯模型的查詢改寫
      2.7.2  基於大語言模型的查詢改寫

    2.8  小結
  第3章  倒排索引技術
    3.1  倒排索引的基本結構
      3.1.1  詞典
      3.1.2  倒排列表
    3.2  索引壓縮演算法
      3.2.1  索引塊壓縮演算法
      3.2.2  位元組壓縮演算法
      3.2.3  索引結構示例
    3.3  索引合併
      3.3.1  倒排列表的基本合併操作
      3.3.2  基於二分查找的倒排索引合併
      3.3.3  基於跳錶的倒排索引合併
    3.4  倒排索引的構建
      3.4.1  關鍵詞分詞
      3.4.2  索引構建
    3.5  倒排索引的分散式服務
    3.6  案例一:使用Lucene進行搜索
    3.7  案例二:基於Elasticsearch的關鍵詞索引
    3.8  小結
  第4章  關鍵詞檢索
    4.1  預備知識與準備工作
    4.2  文本相關性
      4.2.1  命中頻次特徵
      4.2.2  命中緊密度特徵
      4.2.3  語言模型特徵
      4.2.4  意圖匹配特徵
    4.3  權威性計算
    4.4  文檔的時效性計算
    4.5  點擊反饋
    4.6  特徵融合
      4.6.1  線性組合
      4.6.2  相關性優先組合
      4.6.3  機器學習組合
      4.6.4  混合組合
    4.7  小結
  第5章  排序學習
    5.1  排序效果的評價指標
      5.1.1  精確率與召回率
      5.1.2  MRR
      5.1.3  MAP
      5.1.4  AUC
      5.1.5  NDCG
    5.2  經典相關性模型
      5.2.1  BM
      5.2.2  向量空間模型
      5.2.3  語言模型
      5.2.4  經典相關性模型的缺點
    5.3  經典排序學習方法
      5.3.1  Pointwise

      5.3.2  Pairwise
      5.3.3  Listwise
    5.4  經典機器學習模型
      5.4.1  線性函數
      5.4.2  多項式回歸
      5.4.3  邏輯回歸
      5.4.4  梯度提升決策樹
    5.5  特徵工程
    5.6  時效性排序
      5.6.1  時效性排序模型構建
      5.6.2  時效性與相關性的融合
    5.7  使用XGBoost進行搜索排序示例
    5.8  小結
第二部分  深度信息檢索模型與演算法
  第6章  深度召回模型
    6.1  深度召回模型的基本框架
    6.2  詞的編碼與向量化表示
      6.2.1  獨熱編碼
      6.2.2  詞哈希
      6.2.3  詞嵌入
    6.3  短句、句子的表示
      6.3.1  池化
      6.3.2  卷積神經網路
      6.3.3  序列建模
    6.4  案例:基於BERT的深度召回框架
      6.4.1  微調數據準備和採樣策略
      6.4.2  BERT模型微調和訓練過程
      6.4.3  在線召回
      6.4.4  其他基於BERT改進的召回模型
    6.5  混合召回
      6.5.1  混合召回的工作原理
      6.5.2  混合召回的優勢
    6.6  小結
  第7章  k近鄰檢索演算法
    7.1  暴力窮舉方法
    7.2  KD樹
      7.2.1  KD樹構建過程
      7.2.2  KD樹搜索過程
    7.3  局部敏感哈希
      7.3.1  MinHash
      7.3.2  SimHash
      7.3.3  Banding
    7.4  矢量量化
    7.5  HNSW
      7.5.1  NSW
      7.5.2  層級圖結構
    7.6  使用FAISS進行kNN近鄰檢索示例
    7.7  小結
  第8章  深度相關性模型
    8.1  基於交互矩陣的相關性模型

      8.1.1  交互矩陣的核函數
      8.1.2  基於交互矩陣的神經網路模型
    8.2  基於BERT的相關性模型
      8.2.1  用搜索語料做持續預訓練
      8.2.2  用BERT模型做微調
      8.2.3  BERT模型效果分析
    8.3  BERT相關性模型案例實踐
      8.3.1  BERT模型微調示例
      8.3.2  在線推理過程
    8.4  小結
  第9章  深度排序模型
    9.1  精排模型演進
      9.1.1  Wide Deep
      9.1.2  DeepFM
      9.1.3  DIN
      9.1.4  多目標
    9.2  多樣性
      9.2.1  MMR
      9.2.2  DPP
    9.3  數據消偏位置偏差
    9.4  小結
第三部分  AI搜索前沿
  第10章  大語言模型基礎
    10.1  大語言模型技術背景
      10.1.1  Transformer架構
      10.1.2  Scaling Law
    10.2  大語言模型訓練過程
      10.2.1  預訓練:大語言模型訓練的關鍵步驟
      10.2.2  監督微調:從通用到特定的任務
      10.2.3  獎勵建模
    10.3  提示詞工程
      10.3.1  提示詞設計原則
      10.3.2  少樣本提示詞
      10.3.3  思維鏈
    10.4  模型微調
      10.4.1  模型微調的概念
      10.4.2  模型微調的一般過程
    10.5  小結
  第11章  AI搜索實踐
    11.1  基於RAG架構的AI搜索
      11.1.1  索引構建
      11.1.2  查詢理解
      11.1.3  檢索
      11.1.4  生成
    11.2  AI搜索的Agent實現
      11.2.1  搜索任務規劃
      11.2.2  搜索任務執行
      11.2.3  答案滿足判定
      11.2.4  二次規劃
      11.2.5  答案生成

    11.3  知識蒸餾與模型微調
      11.3.1  知識蒸餾的數據準備
      11.3.2  模型微調
    11.4  評估
      11.4.1  評估標準
      11.4.2  評估方法
    11.5  小結
  第12章  生成式信息檢索
    12.1  可微搜索索引
    12.2  標識符學習方法
    12.3  多模態生成式信息檢索
      12.3.1  圖像的向量表徵
      12.3.2  基於CLIP模型的向量檢索
      12.3.3  圖像的量化表徵
      12.3.4  圖像的量化檢索
    12.4  小結
參考文獻

  • 商品搜索:
  • | 高級搜索
首頁新手上路客服中心關於我們聯絡我們Top↑
Copyrightc 1999~2008 美商天龍國際圖書股份有限公司 臺灣分公司. All rights reserved.
營業地址:臺北市中正區重慶南路一段103號1F 105號1F-2F
讀者服務部電話:02-2381-2033 02-2381-1863 時間:週一-週五 10:00-17:00
 服務信箱:bookuu@69book.com 客戶、意見信箱:cs@69book.com
ICP證:浙B2-20060032