幫助中心 | 我的帳號 | 關於我們

特徵工程入門與實踐/圖靈程序設計叢書

  • 作者:(土)錫南·厄茲代米爾//迪夫婭·蘇薩拉|譯者:庄嘉盛
  • 出版社:人民郵電
  • ISBN:9787115511645
  • 出版日期:2019/06/01
  • 裝幀:平裝
  • 頁數:210
人民幣:RMB 59 元      售價:
放入購物車
加入收藏夾

內容大鋼
    機器學習模型的成功正是取決於如何利用不同類型的特徵,例如連續特徵、分類特徵等。本書將帶你了解特徵工程的完整過程,使機器學習更加系統、高效。你會從理解數據開始學習,了解何時納入一項特徵、何時忽略一項特徵,以及其中的原因。你還會學習如何將問題陳述轉換為有用的新特徵,如何提供由商業需求和數學見解驅動的特徵,以及如何在自己的機器上進行機器學習,從而自動學習數據中的特徵。
    本書面向所有希望全面了解特徵工程的讀者,特別適合具有機器學習應用知識並希望改進機器學習模型結果的數據科學家閱讀。

作者介紹
(土)錫南·厄茲代米爾//迪夫婭·蘇薩拉|譯者:庄嘉盛

目錄
第1章  特徵工程簡介
  1.1  激動人心的例子:AI驅動的聊天
  1.2  特徵工程的重要性
  1.3  特徵工程是什麼
  1.4  機器學習演算法和特徵工程的評估
    1.4.1  特徵工程的例子:真的有人能預測天氣嗎
    1.4.2  特徵工程的評估步驟
    1.4.3  評估監督學習演算法
    1.4.4  評估無監督學習演算法
  1.5  特徵理解:我的數據集里有什麼
  1.6  特徵增強:清洗數據
  1.7  特徵選擇:對壞屬性說不
  1.8  特徵構建:能生成新特徵嗎
  1.9  特徵轉換:數學顯神通
  1.10  特徵學習:以AI促AI
  1.11  小結
第2章  特徵理解:我的數據集里有什麼
  2.1  數據結構的有無
  2.2  定量數據和定性數據
  2.3  數據的4個等級
    2.3.1  定類等級
    2.3.2  定序等級
    2.3.3  定距等級
    2.3.4  定比等級
  2.4  數據等級總結
  2.5  小結
第3章  特徵增強:清洗數據
  3.1  識別數據中的缺失值
    3.1.1  皮馬印第安人糖尿病預測數據集
    3.1.2  探索性數據分析
  3.2  處理數據集中的缺失值
    3.2.1  刪除有害的行
    3.2.2  填充缺失值
    3.2.3  在機器學習流水線中填充值
  3.3  標準化和歸一化
    3.3.1  z分數標準化
    3.3.2  min-max標準化
    3.3.3  行歸一化
    3.3.4  整合起來
  3.4  小結
第4章  特徵構建:我能生成新特徵嗎
  4.2  填充分類特徵
    4.2.1  自定義填充器
    4.2.2  自定義分類填充器
    4.2.3  自定義定量填充器
  4.3  編碼分類變數
    4.3.1  定類等級的編碼
    4.3.2  定序等級的編碼
    4.3.3  將連續特徵分箱
    4.3.4  創建流水線

  4.4  擴展數值特徵
    4.4.1  根據胸部加速度計識別動作的數據集
    4.4.2  多項式特徵
  4.5  針對文本的特徵構建
    4.5.1  詞袋法
    4.5.2  CountVectorizer
    4.5.3  TF-IDF向量化器
    4.5.4  在機器學習流水線中使用文本
  4.6  小結
第5章  特徵選擇:對壞屬性說不
  5.1  在特徵工程中實現更好的性能
  5.2  創建基準機器學習流水線
  5.3  特徵選擇的類型
    5.3.1  基於統計的特徵選擇
    5.3.2  基於模型的特徵選擇
  5.4  選用正確的特徵選擇方法
  5.5  小結
第6章  特徵轉換:數學顯神通
  6.1  維度縮減:特徵轉換、特徵選擇與特徵構建
  6.2  主成分分析
    6.2.1  PCA的工作原理
    6.2.2  鳶尾花數據集的PCA——手動處理
    6.2.3  scikit-learn的PCA
    6.2.4  中心化和縮放對PCA的影響
  6.3  線性判別分析
    6.3.1  LDA的工作原理
    6.3.2  在scikit-learn中使用LDA
  6.4  LDA與PCA:使用鳶尾花數據集
  6.5  小結
第7章  特徵學習:以AI促AI
  7.1  數據的參數假設
    7.1.1  非參數謬誤
    7.1.2  本章的演算法
  7.2  受限玻爾茲曼機
    7.2.1  不一定降維
    7.2.2  受限玻爾茲曼機的圖
    7.2.3  玻爾茲曼機的限制
    7.2.4  數據重建
    7.2.5  MNIST數據集
  7.3  伯努利受限玻爾茲曼機
    7.3.1  從MNIST中提取PCA主成分
    7.3.2  從MNIST中提取RBM特徵
    7.4.1  對原始像素值應用線性模型
    7.4.3  對提取的RBM特徵應用線性模型
  7.5  學習文本特徵:詞向量
    7.5.1  詞嵌入
    7.5.2  兩種詞嵌入方法:Word2vec和GloVe
    7.5.3  Word2vec:另一個淺層神經網路
    7.5.4  創建Word2vec詞嵌入的gensim包
    7.5.5  詞嵌入的應用:信息檢索

  7.6  小結
第8章  案例分析
  8.1  案例1:面部識別
    8.1.1  面部識別的應用
    8.1.2  數據
    8.1.3  數據探索
    8.1.4  應用面部識別
  8.2  案例2:預測酒店評論數據的主題
    8.2.1  文本聚類的應用
    8.2.2  酒店評論數據
    8.2.3  數據探索
    8.2.4  聚類模型
    8.2.5  SVD與PCA主成分
    8.2.6  潛在語義分析
  8.3  小結

  • 商品搜索:
  • | 高級搜索
首頁新手上路客服中心關於我們聯絡我們Top↑
Copyrightc 1999~2008 美商天龍國際圖書股份有限公司 臺灣分公司. All rights reserved.
營業地址:臺北市中正區重慶南路一段103號1F 105號1F-2F
讀者服務部電話:02-2381-2033 02-2381-1863 時間:週一-週五 10:00-17:00
 服務信箱:bookuu@69book.com 客戶、意見信箱:cs@69book.com
ICP證:浙B2-20060032