幫助中心 | 我的帳號 | 關於我們

機器學習基礎(面向預測數據分析的演算法實用範例與案例研究)/數據科學與工程技術叢書

  • 作者:(愛爾蘭)約翰·D.凱萊赫//布萊恩·馬克·納米//奧伊弗·達西|責編:張志銘|譯者:顧卓爾
  • 出版社:機械工業
  • ISBN:9787111652335
  • 出版日期:2020/04/01
  • 裝幀:平裝
  • 頁數:352
人民幣:RMB 99 元      售價:
放入購物車
加入收藏夾

內容大鋼
    本書詳細討論了預測數據分析中最重要的機器學習方法,涵蓋基礎理論和實際應用。在討論了從數據到見解再到決策的過程之後,本書描述了機器學習的四種方法:基於信息的學習、基於相似性的學習、基於概率的學習和基於誤差的學習。每種方法都是先對基本概念進行非技術性解釋,然後給出由詳細工作實例加以說明的數學模型和演算法。最後,本書考慮了評估預測模型的技術,並提供了兩個案例研究,展示了機器學習在商業環境中的應用。
    本書可作為高等院校人工智慧、數據科學與大數據、電腦科學、工程學以及數學或統計學專業本科生和研究生的機器學習、數據挖掘、數據分析或人工智慧課程的教材,也可作為數據分析等領域從業者的培訓教材及參考資料。

作者介紹
(愛爾蘭)約翰·D.凱萊赫//布萊恩·馬克·納米//奧伊弗·達西|責編:張志銘|譯者:顧卓爾

目錄
譯者序
前言
符號記法
第1章  面向預測數據分析的機器學習
  1.1  什麼是預測數據分析
  1.2  什麼是機器學習
  1.3  機器學習的工作原理
  1.4  機器學習會產生什麼問題
  1.5  預測數據分析項目的生命周期:CRISP-DM
  1.6  預測數據分析工具
  1.7  本書概覽
  1.8  習題
第2章  數據到見解再到決策
  2.1  將商業問題轉化為分析解決方案
  2.2  可行性評估
  2.3  設計分析基礎表
  2.4  特徵的設計與實現
    2.4.1  不同的數據類型
    2.4.2  不同的特徵類型
    2.4.3  處理時間
    2.4.4  法律問題
    2.4.5  特徵的實現
    2.4.6  案例研究:汽車保險詐騙
  2.5  總結
  2.6  延伸閱讀
  2.7  習題
第3章  數據探索
  3.1  數據質量報告
  3.2  了解數據
    3.2.1  正態分佈
    3.2.2  案例研究:汽車保險詐騙
  3.3  找出數據質量問題
    3.3.1  缺失值
    3.3.2  異常基數
    3.3.3  離群點
    3.3.4  案例研究:汽車保險詐騙
  3.4  處理數據質量問題
    3.4.1  處理缺失值
    3.4.2  處理離群點
    3.4.3  案例研究:汽車保險詐騙
  3.5  高階數據探索
    3.5.1  可視化特徵之間的關係
    3.5.2  度量協方差和相關性
  3.6  數據準備
    3.6.1  歸一化
    3.6.2  分箱
    3.6.3  採樣
  3.7  總結
  3.8  延伸閱讀
  3.9  習題

第4章  基於信息的學習
  4.1  大思路
  4.2  基礎知識
    4.2.1  決策樹
    4.2.2  香農熵模型
    4.2.3  信息增益
  4.3  標準方法:ID3演算法
  4.4  延伸與拓展
    4.4.1  其他特徵選取與純度度量方法
    4.4.2  處理連續描述性特徵
    4.4.3  預測連續目標
    4.4.4  剪枝
    4.4.5  模型組合
  4.5  總結
  4.6  延伸閱讀
  4.7  習題
第5章  基於相似性的學習
  5.1  大思路
  5.2  基本概念
    5.2.1  特徵空間
    5.2.2  用距離度量測量相似性
  5.3  標準方法:最近鄰演算法
  5.4  延伸與拓展
    5.4.1  處理嘈雜數據
    5.4.2  高效內存搜索
    5.4.3  數據歸一化
    5.4.4  預測連續目標
    5.4.5  其他相似性測量
    5.4.6  特徵選取
  5.5  總結
  5.6  延伸閱讀
  5.7  後記
  5.8  習題
第6章  基於概率的學習
  6.1  大思路
  6.2  基礎知識
    6.2.1  貝葉斯定理
    6.2.2  貝葉斯預測
    6.2.3  條件獨立與因子化
  6.3  標準方法:樸素貝葉斯模型
  6.4  延伸與拓展
    6.4.1  平滑
    6.4.2  連續特徵:概率密度函數
    6.4.3  連續特徵:分箱
    6.4.4  貝葉斯網路
  6.5  總結
  6.6  延伸閱讀
  6.7  習題
第7章  基於誤差的學習
  7.1  大思路

  7.2  基礎知識
    7.2.1  簡單線性回歸
    7.2.2  測量誤差
    7.2.3  誤差曲面
  7.3  標準方法:使用梯度下降法的多變數線性回歸
    7.3.1  多變數線性回歸
    7.3.2  梯度下降法
    7.3.3  選擇學習率和初始權值
    7.3.4  實用範例
  7.4  延伸與拓展
    7.4.1  解釋多變數線性回歸模型
    7.4.2  用權值衰減設定學習率
    7.4.3  處理類別描述性特徵
    7.4.4  處理類別目標特徵:對數幾率回歸
    7.4.5  建模非線性關係
    7.4.6  多項對數幾率回歸
    7.4.7  支持向量機
  7.5  總結
  7.6  延伸閱讀
  7.7  習題
第8章  評估
  8.1  大思路
  8.2  基礎知識
  8.3  標準方法:留出測試集上的誤分類率
  8.4  延伸與拓展
    8.4.1  設計評估實驗
    8.4.2  性能度量:類別目標
    8.4.3  性能度量:預測得分
    8.4.4  性能度量:多項目標
    8.4.5  性能度量:連續目標
    8.4.6  評估部署后的模型
  8.5  總結
  8.6  延伸閱讀
  8.7  習題
第9章  案例研究:客戶流失
  9.1  商業理解
  9.2  數據理解
  9.3  數據準備
  9.4  建模
  9.5  評估
  9.6  部署
第10章  案例研究:星系分類
  10.1  商業理解
  10.2  數據理解
  10.3  數據準備
  10.4  建模
    10.4.1  基準模型
    10.4.2  特徵選取
    10.4.3  5級別模型
  10.5  評估

  10.6  部署
第11章  面向預測數據分析的機器學習藝術
  11.1  預測模型的不同視角
  11.2  選擇機器學習方法
    11.2.1  將機器學習方法和項目匹配
    11.2.2  將機器學習方法和數據匹配
  11.3  總結
附錄A  機器學習的描述性統計量與數據可視化
附錄B  機器學習的概率論導論
附錄C  機器學習中的求導方法
參考文獻
索引

  • 商品搜索:
  • | 高級搜索
首頁新手上路客服中心關於我們聯絡我們Top↑
Copyrightc 1999~2008 美商天龍國際圖書股份有限公司 臺灣分公司. All rights reserved.
營業地址:臺北市中正區重慶南路一段103號1F 105號1F-2F
讀者服務部電話:02-2381-2033 02-2381-1863 時間:週一-週五 10:00-17:00
 服務信箱:bookuu@69book.com 客戶、意見信箱:cs@69book.com
ICP證:浙B2-20060032