幫助中心 | 我的帳號 | 關於我們

Python機器學習基礎教程/圖靈程序設計叢書

  • 作者:(德)安德里亞斯·穆勒//(美)莎拉·吉多|譯者:張亮
  • 出版社:人民郵電
  • ISBN:9787115475619
  • 出版日期:2018/01/01
  • 裝幀:平裝
  • 頁數:285
人民幣:RMB 79 元      售價:
放入購物車
加入收藏夾

內容大鋼
    安德里亞斯·穆勒、莎拉·吉多著的《Python機器學習基礎教程》是機器學習入門書,以Python語言介紹。主要內容包括:機器學習的基本概念及其應用;實踐中最常用的機器學習演算法以及這些演算法的優缺點;在機器學習中待處理數據的呈現方式的重要性,以及應重點關注數據的哪些方面;模型評估和調參的高級方法,重點講解交叉驗證和網格搜索;管道的概念;如何將前面各章的方法應用到文本數據上,還介紹了一些文本特有的處理方法。
    本書適合機器學習從業者或有志成為機器學習從業者的人閱讀。

作者介紹
(德)安德里亞斯·穆勒//(美)莎拉·吉多|譯者:張亮

目錄
前言
第1章  引言
  1.1  為何選擇機器學習
    1.1.1  機器學習能夠解決的問題
    1.1.2  熟悉任務和數據
  1.2  為何選擇Python
  1.3  scikit-learn
  1.4  必要的庫和工具
    1.4.1  Jupyter Notebook
    1.4.2  NumPy
    1.4.3  SciPy
    1.4.4  matplotlib
    1.4.5  pandas
    1.4.6  mglearn
  1.5  Python 2 與Python 3的對比
  1.6  本書用到的版本
  1.7  第一個應用:鳶尾花分類
    1.7.1  初識數據
    1.7.2  衡量模型是否成功:訓練數據與測試數據
    1.7.3  要事第一:觀察數據
    1.7.4  構建第一個模型:k近鄰演算法
    1.7.5  做出預測
    1.7.6  評估模型
  1.8  小結與展望
第2章  監督學習
  2.1  分類與回歸
  2.2  泛化、過擬合與欠擬合
  2.3  監督學習演算法
    2.3.1  一些樣本數據集
    2.3.2  k近鄰
    2.3.3  線性模型
    2.3.4  樸素貝葉斯分類器
    2.3.5  決策樹
    2.3.6  決策樹集成
    2.3.7  核支持向量機
    2.3.8  神經網路(深度學習)
  2.4  分類器的不確定度估計
    2.4.1  決策函數
    2.4.2  預測概率
    2.4.3  多分類問題的不確定度
  2.5  小結與展望
第3章  無監督學習與預處理
  3.1  無監督學習的類型
  3.2  無監督學習的挑戰
  3.3  預處理與縮放
    3.3.1  不同類型的預處理
    3.3.2  應用數據變換
    3.3.3  對訓練數據和測試數據進行相同的縮放
    3.3.4  預處理對監督學習的作用
  3.4  降維、特徵提取與流形學習

    3.4.1  主成分分析
    3.4.2  非負矩陣分解
    3.4.3  用t-SNE進行流形學習
  3.5  聚類
    3.5.1  k均值聚類
    3.5.2  凝聚聚類
    3.5.3  DBSCAN
    3.5.4  聚類演算法的對比與評估
    3.5.5  聚類方法小結
  3.6  小結與展望
第4章  數據表示與特徵工程
  4.1  分類變數
    4.1.1  One-Hot編碼(虛擬變數)
    4.1.2  數字可以編碼分類變數
  4.2  分箱、離散化、線性模型與樹
  4.3  交互特徵與多項式特徵
  4.4  單變數非線性變換
  4.5  自動化特徵選擇
    4.5.1  單變數統計
    4.5.2  基於模型的特徵選擇
    4.5.3  迭代特徵選擇
  4.6  利用專家知識
  4.7  小結與展望
第5章  模型評估與改進
  5.1  交叉驗證
    5.1.1  scikit-learn 中的交叉驗證
    5.1.2  交叉驗證的優點
    5.1.3  分層k 折交叉驗證和其他策略
  5.2  網格搜索
    5.2.1  簡單網格搜索
    5.2.2  參數過擬合的風險與驗證集
    5.2.3  帶交叉驗證的網格搜索
  5.3  評估指標與評分
    5.3.1  牢記目標
    5.3.2  二分類指標
    5.3.3  多分類指標
    5.3.4  回歸指標
    5.3.5  在模型選擇中使用評估指標
  5.4  小結與展望
第6章  演算法鏈與管道
  6.1  用預處理進行參數選擇
  6.2  構建管道
  6.3  在網格搜索中使用管道
  6.4  通用的管道介面
    6.4.1  用make_pipeline方便地創建管道
    6.4.2  訪問步驟屬性
    6.4.3  訪問網格搜索管道中的屬性
  6.5  網格搜索預處理步驟與模型參數
  6.6  網格搜索選擇使用哪個模型
  6.7  小結與展望

第7章  處理文本數據
  7.1  用字元串表示的數據類型
  7.2  示例應用:電影評論的情感分析
  7.3  將文本數據表示為詞袋
    7.3.1  將詞袋應用於玩具數據集
    7.3.2  將詞袋應用於電影評論
  7.4  停用詞
  7.5  用tf-idf縮放數據
  7.6  研究模型係數
  7.7  多個單詞的詞袋(n元分詞)
  7.8  分詞、詞幹提取與詞形還原
  7.9  主題建模與文檔聚類
  7.10  小結與展望
第8章  全書總結
  8.1  處理機器學習問題
  8.2  從原型到生產
  8.3  測試生產系統
  8.4  構建你自己的估計器
  8.5  下一步怎麼走
    8.5.1  理論
    8.5.2  其他機器學習框架和包
    8.5.3  排序、推薦系統與其他學習類型
    8.5.4  概率建模、推斷與概率編程
    8.5.5  神經網路
    8.5.6  推廣到更大的數據集
    8.5.7  磨練你的技術
  8.6  總結
關於作者
關於封面

  • 商品搜索:
  • | 高級搜索
首頁新手上路客服中心關於我們聯絡我們Top↑
Copyrightc 1999~2008 美商天龍國際圖書股份有限公司 臺灣分公司. All rights reserved.
營業地址:臺北市中正區重慶南路一段103號1F 105號1F-2F
讀者服務部電話:02-2381-2033 02-2381-1863 時間:週一-週五 10:00-17:00
 服務信箱:bookuu@69book.com 客戶、意見信箱:cs@69book.com
ICP證:浙B2-20060032