幫助中心 | 我的帳號 | 關於我們

互聯網大廠推薦演算法實戰

  • 作者:趙傳霖|責編:傅道坤
  • 出版社:人民郵電
  • ISBN:9787115628688
  • 出版日期:2024/01/01
  • 裝幀:平裝
  • 頁數:298
人民幣:RMB 89.8 元      售價:
放入購物車
加入收藏夾

內容大鋼
    本書介紹了互聯網大廠當前採用的一些前沿推薦演算法,並梳理了這些演算法背後的思想脈絡與技術框架。
    本書總計10章,內容涵蓋了推薦系統的基礎知識、推薦系統中的特徵工程、推薦系統中的Embedding、推薦系統的各組成模塊(包括召回、粗排、精排與重排)所使用的演算法技術、推薦演算法實踐中經常會遇到的難題以及應對之道(其中涉及多任務推薦、多場景推薦、新用戶冷啟動、新物料冷啟動、評估模型效果、定位並解決問題等),最後還用一章的篇幅介紹了推薦演算法工程師在工作、學習、面試時應該採取的做法。
    本書既適合推薦系統、計算廣告、個性化搜索領域的從業人員閱讀,也適合希望從事互聯網演算法工作的在校學生閱讀。

作者介紹
趙傳霖|責編:傅道坤
    趙傳霖,博士,畢業於清華大學電氣工程專業,知乎「機器學習」話題優秀答主,目前在北京快手科技有限公司擔任演算法專家,擁有10余年的互聯網演算法從業經驗,主要研究方向為推薦系統、計算廣告、個性化搜索。分別以知乎的「石塔西」賬號和微信的「石塔西的說書館」公眾號發表了多篇以推薦演算法為主題的原創性文章,深受廣大讀者的好評,並曾經4次獲得知乎創作排行榜「知勢榜?影響力榜」(科技互聯網領域)第1名。

目錄
第1章  推薦系統簡介
  1.1  推薦系統的意義
  1.2  推薦系統是如何運行的
  1.3  推薦系統架構
    1.3.1  功能架構
    1.3.2  數據架構
  1.4  推廣搜的區別與聯繫
    1.4.1  三駕馬車的相同點
    1.4.2  推薦與搜索
    1.4.3  推搜與廣告
  1.5  小結
第2章  推薦系統中的特徵工程
  2.1  批判「特徵工程過時」的錯誤論調
  2.2  特徵提取
    2.2.1  物料畫像
    2.2.2  用戶畫像
    2.2.3  交叉特徵
    2.2.4  偏差特徵
  2.3  數值特徵的處理
    2.3.1  處理缺失值
    2.3.2  標準化
    2.3.3  數據平滑與消偏
    2.3.4  分桶離散化
  2.4  類別特徵的處理
    2.4.1  類別特徵更受歡迎
    2.4.2  類別特徵享受VIP服務
    2.4.3  映射
    2.4.4  特徵哈希
  2.5  小結
第3章  推薦系統中的Embedding
  3.1  無中生有:推薦演算法中的Embedding
    3.1.1  傳統推薦演算法:博聞強識
    3.1.2  推薦演算法的剛需:擴展性
    3.1.3  深度學習的核心思想:無中生有的Embedding
    3.1.4  Embedding的實現細節
  3.2  共享Embedding還是獨佔Embedding
    3.2.1  共享Embedding
    3.2.2  獨佔Embedding
  3.3  Parameter Server:推薦演算法的訓練加速器
    3.3.1  傳統分散式計算的不足
    3.3.2  基於PS的分散式訓練範式
    3.3.3  PS中的並行策略
    3.3.4  基於ps-lite實現分散式演算法
    3.3.5  更先進的PS
  3.4  小結
第4章  精排
  4.1  推薦演算法的5個維度
  4.2  交叉結構
    4.2.1  FTRL:傳統時代的記憶大師
    4.2.2  FM:半隻腳邁入DNN的門檻

    4.2.3  Wide & Deep:兼顧記憶與擴展
    4.2.4  DeepFM:融合二階交叉
    4.2.5  DCN:不再執著于DNN
    4.2.6  AutoInt:變形金剛做交叉
  4.3  用戶行為序列建模
    4.3.1  行為序列信息的構成
    4.3.2  簡單Pooling
    4.3.3  用戶建模要「千物千面」
    4.3.4  建模序列內的依賴關係
    4.3.5  多多益善:建模長序列
  4.4  小結
第5章  召回
  5.1  傳統召回演算法
    5.1.1  基於物料屬性的倒排索引
    5.1.2  基於統計的協同過濾演算法
    5.1.3  矩陣分解演算法
    5.1.4  如何合併多路召回
  5.2  向量化召回統一建模框架
    5.2.1  如何定義正樣本
    5.2.2  重點關注負樣本
    5.2.3  解耦生成Embedding
    5.2.4  如何定義優化目標
  5.3  借助Word2Vec
    5.3.1  最簡單的Item2Vec
    5.3.2  Airbnb召回演算法
    5.3.3  阿里巴巴的EGES召回
  5.4  「瑞士軍刀」FM的召回功能
    5.4.1  打壓熱門物料
    5.4.2  增廣Embedding
  5.5  大廠主力:雙塔模型
    5.5.1  不同場景下的正樣本
    5.5.2  簡化負採樣
    5.5.3  雙塔結構特點
    5.5.4  Sampled Softmax Loss的技巧
    5.5.5  雙塔模型實現舉例
  5.6  鄰里互助:GCN召回
    5.6.1  GCN基礎
    5.6.2  PinSage:大規模圖卷積的經典案例
    5.6.3  異構圖上的GCN
  5.7  小結
第6章  粗排與重排
  6.1  粗排
    6.1.1  模型:雙塔仍然是主力
    6.1.2  目標:拜精排為師
    6.1.3  數據:糾正曝光偏差
    6.1.4  模型:輕量級全連接
  6.2  重排
    6.2.1  基於啟髮式規則
    6.2.2  基於行列式點過程
    6.2.3  基於上下文感知的排序學習

  6.3  小結
第7章  多任務與多場景
  7.1  多任務推薦
    7.1.1  多任務建模的誤區
    7.1.2  併發建模
    7.1.3  串列建模
    7.1.4  多個損失的融合
    7.1.5  多個打分的融合
  7.2  多場景推薦
    7.2.1  特徵位置
    7.2.2  模型結構
    7.2.3  模型參數
  7.3  小結
第8章  冷啟動
  8.1  Bandit演算法
    8.1.1  多臂老虎機問題
    8.1.2  Epsilon Greedy
    8.1.3  UCB
    8.1.4  概率匹配
    8.1.5  Bayesian Bandit
    8.1.6  上下文Bandit
  8.2  元學習
    8.2.1  什麼是元學習
    8.2.2  什麼是MAML
    8.2.3  MAML針對推薦場景的改造
    8.2.4  Meta-Embedding
  8.3  對比學習
    8.3.1  對比學習簡介
    8.3.2  對比學習在推薦系統中的作用與使用方式
    8.3.3  辨析對比學習與向量化召回
    8.3.4  糾偏長尾物料的實踐
    8.3.5  糾偏小眾用戶的實踐
  8.4  其他演算法
    8.4.1  遷移學習
    8.4.2  預測物料消費指標
    8.4.3  以群體代替個體
    8.4.4  借鑒多場景推薦
  8.5  小結
第9章  評估與調試
  9.1  離線評估
    9.1.1  評估排序演算法
    9.1.2  評估召回演算法
    9.1.3  人工評測
    9.1.4  持續評估
  9.2  在線評估:A/B實驗
    9.2.1  線上:流量劃分
    9.2.2  線下:統計分析
  9.3  打開模型的黑盒
    9.3.1  外部觀察
    9.3.2  內部剖析

  9.4  線下漲了,線上沒效果
    9.4.1  特徵穿越
    9.4.2  老湯模型
    9.4.3  冰山:系統的內在缺陷
    9.4.4  鏈路一致性問題
  9.5  小結
第10章  推薦演算法工程師的自我修養
  10.1  工作
    10.1.1  重視代碼的規範性
    10.1.2  重視離線評測
    10.1.3  重視使用工具
  10.2  學習
    10.2.1  堅持問題導向
    10.2.2  重在舉一反三
    10.2.3  敢於懷疑
    10.2.4  落實代碼細節
  10.3  面試
    10.3.1  社招
    10.3.2  校招
  10.4  小結

  • 商品搜索:
  • | 高級搜索
首頁新手上路客服中心關於我們聯絡我們Top↑
Copyrightc 1999~2008 美商天龍國際圖書股份有限公司 臺灣分公司. All rights reserved.
營業地址:臺北市中正區重慶南路一段103號1F 105號1F-2F
讀者服務部電話:02-2381-2033 02-2381-1863 時間:週一-週五 10:00-17:00
 服務信箱:bookuu@69book.com 客戶、意見信箱:cs@69book.com
ICP證:浙B2-20060032