幫助中心 | 我的帳號 | 關於我們

檢索匹配(深度學習在搜索廣告推薦系統中的應用)/大數據科學叢書

  • 作者:編者:康善同|責編:張淑謙
  • 出版社:機械工業
  • ISBN:9787111706076
  • 出版日期:2022/06/01
  • 裝幀:平裝
  • 頁數:194
人民幣:RMB 79 元      售價:
放入購物車
加入收藏夾

內容大鋼
    本書主要介紹了深度學習在互聯網核心的三大類業務(搜索、廣告、推薦系統)檢索系統中的應用。書中詳細講述了檢索匹配的理論、演進歷史,以及在業務中落地一個基於深度學習演算法模型的全流程技能,包括業務問題建模、樣本準備、特徵抽取、模型訓練和預測等,並提供了相應的代碼。
    全書共11章,分為四大部分。第1部分(第1?2章)介紹了深度學習的相關理論知識;第2部分(第3?6章)介紹了業務中如何上線一個深度學習模型,包括標籤拼接、特徵抽取、模型訓練和預測等流程,採用單機實現;第3部分(第7?9章)介紹了檢索演算法基本理論以及演進歷史,並以業內應用較為廣泛的雙塔模型DSSM為例進行了詳細理論解析和代碼實現;第4部分(第10?11章)介紹了如何將單機訓練模式改造為分散式訓練模式,以加快模型的訓練速度,從而應對具有海量樣本的業務場景。
    本書為讀者提供了全部案例源代碼下載和超過180分鐘的高清學習視頻,讀者可直接掃描二維碼觀看。
    本書旨在為讀者介紹深度學習在互聯網業務中落地的方法和實現,主要面向演算法工程師、相關領域研究人員和相關專業院校師生。

作者介紹
編者:康善同|責編:張淑謙
    康善同,本科畢業於南京大學;于北京大學獲得電腦系統結構碩士學位;有十余年的互聯網大廠一線演算法相關工作經驗。

目錄
前言
第1部分  理論準備
  第1章  深度學習時代
    1.1  深度學習的飛速發展
    1.2  深度學習在互聯網的應用
      1.2.1  搜索
      1.2.2  推薦
      1.2.3  廣告
      1.2.4  通用檢索流程
    1.3  深度學習模型分類
    1.4  模型服務中台
    1.5  分散式機器學習
    1.6  深度學習軟體框架
    1.7  小結
  第2章  深度學習簡介
    2.1  生物神經網路
    2.2  人工神經網路
    2.3  業務問題建模
    2.4  DNN的擬合能力
    2.5  DNN的學習方式
    2.6  CNN與RNN
    2.7  小結
第2部分  設計與實現
  第3章  標籤拼接
    3.1  時間窗口
    3.2  延遲反饋
    3.3  樣本集介紹
      3.3.1  原始樣本
      3.3.2  廣告基本信息表
      3.3.3  用戶基本信息表
      3.3.4  用戶的行為日誌
    3.4  小結
  第4章  特徵處理
    4.1  特徵分類
    4.2  特徵體系
    4.3  原始特徵拼接
      4.3.1  拼接方法
      4.3.2  數據集特徵拼接
      4.3.3  代碼
    4.4  明文特徵抽取
      4.4.1  特徵抽取運算元
      4.4.2  特徵抽取示例
    4.5  特徵ID化
      4.5.1  特徵詞表生成
      4.5.2  ID化示例
    4.6  代碼說明
    4.7  小結
  第5章  模型構建
    5.1  DNN求解
      5.1.1  數學規劃

      5.1.2  DNN方法
    5.2  模型層
      5.2.1  輸入層
      5.2.2  神經網路層
      5.2.3  激活函數層
    5.3  模型結構
      5.3.1  DLRM模型
      5.3.2  模型搭建
    5.4  損失函數
      5.4.1  MSE損失函數
      5.4.2  CrossEntropy損失函數
    5.5  優化器
      5.5.1  SGD
      5.5.2  Momentum
      5.5.3  Nesterov
      5.5.4  AdaGrad
      5.5.5  Adam
      5.5.6  擴展
    5.6  小結
  第6章  模型訓練與預測
    6.1  模型評估
    6.2  模型訓練
      6.2.1  模型訓練流程
      6.2.2  模型訓練技巧
    6.3  模型預測
    6.4  訓練效果示例
    6.5  模型優化
    6.6  GPU應用
    6.7  小結
第3部分  高級深度學習模型
  第7章  檢索演算法理論
    7.1  檢索演算法抽象
    7.2  有表示匹配
      7.2.1  標籤表示
      7.2.2  分散式表示
    7.3  無表示匹配
    7.4  內容理解
      7.4.1  自然語言處理
      7.4.2  電腦視覺
      7.4.3  一點思考
    7.5  用戶理解
    7.6  總結
  第8章  檢索演算法演進
    8.1  前深度學習時代
      8.1.1  LR
      8.1.2  決策樹
      8.1.3  協同過濾
      8.1.4  MF
      8.1.5  演算法應用
    8.2  深度學習時代

      8.2.1  精排模型演進
      8.2.2  粗排模型演進
      8.2.3  召回模型演進
    8.3  小結
  第9章  DSSM理論與實現
    9.1  DSSM模型
    9.2  DSSM實現
    9.3  線上預測
    9.4  ANN檢索
      9.4.1  基於樹的方法
      9.4.2  基於Hash的方法
      9.4.3  基於圖的方法
      9.4.4  ANN檢索效率比較
    9.5  訓練效果
    9.6  模型優化
    9.7  小結
第4部分  分散式機器學習
  第10章  電腦系統
    10.1  單機系統
      10.1.1  單機系統物理模型
      10.1.2  單機系統程序編程
    10.2  分散式系統
      10.2.1  分散式計算
      10.2.2  分散式存儲
      10.2.3  分散式協同通信
      10.2.4  CAP理論
      10.2.5  一點思考
    10.3  分散式系統示例
    10.4  分散式編程示例
    10.5  小結
  第11章  分散式機器學習設計與實現
    11.1  機器學習應用系統設計
    11.2  分散式機器學習設計
      11.2.1  並行方式
      11.2.2  節點協作方式
      11.2.3  模型更新方式
    11.3  常用的分散式學習框架
    11.4  PS Lite介紹
      11.4.1  代碼架構
      11.4.2  工作流程
    11.5  分散式訓練實現
      11.5.1  架構設計
      11.5.2  代碼實現
      11.5.3  程序運行
      11.5.4  模型保存與載入
      11.5.5  效果評估
    11.6  小結
結語
附錄
  附錄A  輔助學習資料

  • 商品搜索:
  • | 高級搜索
首頁新手上路客服中心關於我們聯絡我們Top↑
Copyrightc 1999~2008 美商天龍國際圖書股份有限公司 臺灣分公司. All rights reserved.
營業地址:臺北市中正區重慶南路一段103號1F 105號1F-2F
讀者服務部電話:02-2381-2033 02-2381-1863 時間:週一-週五 10:00-17:00
 服務信箱:bookuu@69book.com 客戶、意見信箱:cs@69book.com
ICP證:浙B2-20060032