幫助中心 | 我的帳號 | 關於我們

深入理解XGBoost(高效機器學習演算法與進階)/智能系統與技術叢書

  • 作者:何龍
  • 出版社:機械工業
  • ISBN:9787111642626
  • 出版日期:2020/01/01
  • 裝幀:平裝
  • 頁數:370
人民幣:RMB 99 元      售價:
放入購物車
加入收藏夾

內容大鋼
    本書以機器學習必會知識做鋪墊,深入剖析XGBoost的原理、分散式實現、深度應用、模型選擇與優化等。
    第1?3章使讀者對機器學習演算法有整體認知,了解如何在模型訓練過程中進行優化、評估模型結果,並熟悉常用機器學習演算法的實現原理和應用,如線性回歸、邏輯回歸、決策樹、神經網路、支持向量機等。
    第4章是簡單的實際案例,講解如何通過XGBoost解決分類、回歸、排序等問題,以及XGBoost中常用功能。
    第5?7章是本書重點,從原理與源碼層面深入剖析XGBoost,涵蓋XGBoost原理與理論證明、分散式XGBoost的實現、XGBoost中各個組件的源碼解析。
    第8?9章為進階內容,幫讀者打通實踐中的演算法與工程難點,更好地解決實際問題。
    第10章介紹了樹模型與其他模型融合的一些較為前沿的研究方法,以開拓眼界,拓展思路。

作者介紹
何龍
    何龍,現就職于滴滴出行,XGBoost開源社區貢獻者,專註於人工智能和機器學習領域,從底層演算法原理到上層應用實踐都有廣泛的興趣和研究。較早接觸XGBoost,熟悉XGBoost應用開發,深入閱讀源碼,具有豐富的項目開發經驗。

目錄
前言
第1章  機器學習概述
  1.1  何謂機器學習
    1.1.1  機器學習常用基本概念
    1.1.2  機器學習類型
    1.1.3  機器學習應用開發步驟
  1.2  集成學習發展與XGBoost提出
    1.2.1  集成學習
    1.2.2  XGBoost
  1.3  小結
第2章  XGBoost驪珠初探
  2.1  搭建Python機器學習環境
    2.1.1  Jupyter Notebook
    2.1.2  NumPy
    2.1.3  Pandas
    2.1.4  Matplotlib
    2.1.5  scikit-learn
  2.2  搭建XGBoost運行環境
  2.3  示例:XGBoost告訴你蘑菇是否有毒
  2.4  小結
第3章  機器學習演算法基礎
  3.1  KNN
    3.1.1  KNN關鍵因素
    3.1.2  用KNN預測鳶尾花品種
  3.2  線性回歸
    3.2.1  梯度下降法
    3.2.2  模型評估
    3.2.3  通過線性回歸預測波士頓房屋價格
  3.3  邏輯回歸
    3.3.1  模型參數估計
    3.3.2  模型評估
    3.3.3  良性/惡性乳腺腫瘤預測
    3.3.4  softmax
  3.4  決策樹
    3.4.1  構造決策樹
    3.4.2  特徵選擇
    3.4.3  決策樹剪枝
    3.4.4  決策樹解決腫瘤分類問題
  3.5  正則化
  3.6  排序
    3.6.1  排序學習演算法
    3.6.2  排序評價指標
  3.7  人工神經網路
    3.7.1  感知器
    3.7.2  人工神經網路的實現原理
    3.7.3  神經網路識別手寫體數字
  3.8  支持向量機
    3.8.1  核函數
    3.8.2  鬆弛變數
    3.8.3  通過SVM識別手寫體數字

  3.9  小結
第4章  XGBoost小試牛刀
  4.1  XGBoost實現原理
  4.2  二分類問題
  4.3  多分類問題
  4.4  回歸問題
  4.5  排序問題
  4.6  其他常用功能
  4.7  小結
第5章  XGBoost原理與理論證明
  5.1  CART
    5.1.1  CART生成
    5.1.2  剪枝演算法
  5.2  Boosting演算法思想與實現
    5.2.1  AdaBoost
    5.2.2  Gradient Boosting
    5.2.3  縮減
    5.2.4  Gradient Tree Boosting
  5.3  XGBoost中的Tree Boosting
    5.3.1  模型定義
    5.3.2  XGBoost中的Gradient Tree Boosting
  5.4  切分點查找演算法
    5.4.1  精確貪心演算法
    5.4.2  基於直方圖的近似演算法
    5.4.3  快速直方圖演算法
    5.4.4  加權分位數概要演算法
    5.4.5  稀疏感知切分點查找演算法
  5.5  排序學習
  5.6  DART
  5.7  樹模型的可解釋性
    5.7.1  Saabas
    5.7.2  SHAP
  5.8  線性模型原理
    5.8.1  Elastic Net回歸
    5.8.2  並行坐標下降法
    5.8.3  XGBoost線性模型的實現
  5.9  系統優化
    5.9.1  基於列存儲數據塊的並行學習
    5.9.2  緩存感知訪問
    5.9.3  外存塊計算
  5.10  小結
第6章  分散式XGBoost
  6.1  分散式機器學習框架Rabit
    6.1.1  AllReduce
    6.1.2  Rabit
    6.1.3  Rabit應用
  6.2  資源管理系統YARN
    6.2.1  YARN的基本架構
    6.2.2  YARN的工作流程
    6.2.3  XGBoost on YARN

  6.3  可移植分散式XGBoost4J
  6.4  基於Spark平台的實現
    6.4.1  Spark架構
    6.4.2  RDD
    6.4.3  XGBoost4J-Spark
  6.5  基於Flink平台的實現
    6.5.1  Flink原理簡介
    6.5.2  XGBoost4J-Flink
  6.6  基於GPU加速的實現
    6.6.1  GPU及其編程語言簡介
    6.6.2  XGBoost GPU加速原理
    6.6.3  XGBoost GPU應用
  6.7  小結
第7章  XGBoost進階
  7.1  模型訓練、預測及解析
    7.1.1  樹模型訓練
    7.1.2  線性模型訓練
    7.1.3  模型預測
    7.1.4  模型解析
  7.2  樹模型更新
    7.2.1  updater_colmaker
    7.2.2  updater_histmaker
    7.2.3  updater_fast_hist
    7.2.4  其他更新器
  7.3  目標函數
    7.3.1  二分類
    7.3.2  回歸
    7.3.3  多分類
    7.3.4  排序學習
  7.4  評估函數
    7.4.1  概述
    7.4.2  二分類
    7.4.3  多分類
    7.4.4  回歸
    7.4.5  排序
  7.5  小結
第8章  模型選擇與優化
  8.1  偏差與方差
  8.2  模型選擇
    8.2.1  交叉驗證
    8.2.2  Bootstrap
  8.3  超參數優化
    8.3.1  網格搜索
    8.3.2  隨機搜索
    8.3.3  貝葉斯優化
  8.4  XGBoost超參數優化
    8.4.1  XGBoost參數介紹
    8.4.2  XGBoost調參示例
  8.5  小結
第9章  通過XGBoost實現廣告分類器

  9.1  PCA
    9.1.1  PCA的實現原理
    9.1.2  通過PCA對人臉識別數據降維
    9.1.3  利用PCA實現數據可視化
  9.2  通過XGBoost實現廣告分類器
  9.3  小結
第10章  基於樹模型的其他研究與應用
  10.1  GBDT、LR融合提升廣告點擊率
  10.2  mGBDT
  10.3  DEF
  10.4  一種基於樹模型的強化學習方法
  10.5  小結

  • 商品搜索:
  • | 高級搜索
首頁新手上路客服中心關於我們聯絡我們Top↑
Copyrightc 1999~2008 美商天龍國際圖書股份有限公司 臺灣分公司. All rights reserved.
營業地址:臺北市中正區重慶南路一段103號1F 105號1F-2F
讀者服務部電話:02-2381-2033 02-2381-1863 時間:週一-週五 10:00-17:00
 服務信箱:bookuu@69book.com 客戶、意見信箱:cs@69book.com
ICP證:浙B2-20060032