幫助中心 | 我的帳號 | 關於我們

Python大規模機器學習/智能系統與技術叢書

  • 作者:(荷)巴斯蒂安·賈丁//(意)盧卡·馬薩羅//阿爾貝托·博斯凱蒂|譯者:王貴財//劉春明
  • 出版社:機械工業
  • ISBN:9787111623144
  • 出版日期:2019/05/01
  • 裝幀:平裝
  • 頁數:299
人民幣:RMB 89 元      售價:
放入購物車
加入收藏夾

內容大鋼
    本書三位作者致力於人工智慧和數據分析領域的工作,曾為世界各地的公司和政府機構構建數據科學和人工智慧項目,本書是他們十余年實踐經驗的結晶。書中不僅介紹大規模機器學習的基本概念,還包含豐富的案例研究,全部內容均針對最實用的技術和工具,對理論細節不作深入討論。不管是初學者、普通用戶還是專家級用戶,通過閱讀本書都能了解和掌握如何利用Python進行大規模機器學習。
    本書由淺入深講解大量實例,圖文並茂呈現每一步的操作結果,可幫助你更好地掌握大規模機器學習所需的Python技術,包括基於Scikit-learn可擴展學習、Liblinear和Vowpal Wabbit快速支持向量機、基於Theano與H20的大規模深度學習方法、TensorFlow深度學習技術與在線神經網路方法、大規模分類和回歸樹的可擴展解決方案、大規模無監督學習(PCA、聚類分析和主題建模等)擴展方法、Hadoop和Spark分散式環境、Spark機器學習實踐以及Theano和GPU計算的基礎知識等。

作者介紹
(荷)巴斯蒂安·賈丁//(意)盧卡·馬薩羅//阿爾貝托·博斯凱蒂|譯者:王貴財//劉春明

目錄
譯者序
前言
作者簡介
審校者簡介
第1章  邁向可擴展性的第一步
  1.1  詳細解釋可擴展性
    1.1.1  大規模實例
    1.1.2  介紹Python
    1.1.3  使用Python進行向上擴展
    1.1.4  使用Python進行向外擴展
  1.2  Python用於大規模機器學習
    1.2.1  選擇Python 2還是Python 3
    1.2.2  安裝Python
    1.2.3  逐步安裝
    1.2.4  安裝軟體包
    1.2.5  軟體包升級
    1.2.6  科學計算髮行版
    1.2.7  Jupyter/IPython介紹
  1.3  Python包
    1.3.1  NumPy
    1.3.2  SciPy
    1.3.3  pandas
    1.3.4  Scikit-learn
    1.3.5  小結
第2章  Scikit-learn中的可擴展學習
  2.1  非核心學習
    2.1.1  選擇子採樣
    2.1.2  一次優化一個實例
    2.1.3  構建非核心學習系統
  2.2  流化源數據
    2.2.1  處理真實數據集
    2.2.2  第一個示例——流化共享單車數據集
    2.2.3  使用pandas I/O工具
    2.2.4  使用資料庫
    2.2.5  關注實例排序
  2.3  隨機學習
    2.3.1  批處理梯度下降
    2.3.2  隨機梯度下降
    2.3.3  Scikit-learn的SGD實現
    2.3.4  定義SGD學習參數
  2.4  數據流的特徵管理
    2.4.1  描述目標
    2.4.2  哈希技巧
    2.4.3  其他基本變換
    2.4.4  流測試和驗證
    2.4.5  使用SGD
  2.5  小結
第3章  實現快速SVM
  3.1  測試數據集
    3.1.1  共享單車數據集

    3.1.2  森林覆蓋類型數據集
  3.2  支持向量機
    3.2.1  hinge loss及其變形
    3.2.2  Scikit-learn的SVM實現
    3.2.3  探究通過子採樣改善非線性SVM
    3.2.4  使用SGD實現大規模SVM
  3.3  正則化特徵選擇
  3.4  SGD中的非線性
  3.5  超參數調整
  3.6  小結
第4章  神經網路與深度學習
  4.1  神經網路架構
    4.1.1  神經網路如何學習
    4.1.2  選擇正確的架構
    4.1.3  使用神經網路
    4.1.4  sknn並行化
  4.2  神經網路和正則化
  4.3  神經網路和超參數優化
  4.4  神經網路和決策邊界
  4.5  用H2O進行規模化深度學習
    4.5.1  用H2O進行大規模深度學習
    4.5.2  H2O上的網格搜索
  4.6  深度學習和無監督預訓練
  4.7  使用theanets進行深度學習
  4.8  自動編碼器和無監督學習
  4.9  小結
第5章  用TensorFlow進行深度學習
  5.1  TensorFlow安裝
  5.2  在TensorFlow上使用SkFlow進行機器學習
  5.3  安裝Keras和TensorFlow
  5.4  在TensorFlow中通過Keras實現卷積神經網路
    5.4.1  卷積層
    5.4.2  池化層
    5.4.3  全連接層
  5.5  增量CNN方法
  5.6  GPU計算
  5.7  小結
第6章  大規模分類和回歸樹
  6.1  bootstrap聚合
  6.2  隨機森林和極端隨機森林
  6.3  隨機搜索實現快速參數優化
  6.4  CART和boosting
  6.5  XGBoost
    6.5.1  XGBoost回歸
    6.5.2  XGBoost流化大型數據集
    6.5.3  XGBoost模型存儲
  6.6  用H2O實現非核心CART
    6.6.1  H2O上的隨機森林和網格搜索
    6.6.2  H2O上的隨機梯度增強和網格搜索
  6.7  小結

第7章  大規模無監督學習
  7.1  無監督方法
  7.2  特徵分解:PCA
    7.2.1  隨機化PCA
    7.2.2  增量PCA
    7.2.3  稀疏PCA
  7.3  使用H2O的PCA
  7.4  K-均值聚類演算法
    7.4.1  初始化方法
    7.4.2  K-均值假設
    7.4.3  選擇最佳K
    7.4.4  擴展K-均值演算法:小批量
  7.5  用H2O實現K-均值
  7.6  LDA
  7.7  小結
第8章  分散式環境——Hadoop和Spark
  8.1  從單機到集群
  8.2  設置VM
    8.2.1  VirtualBox
    8.2.2  Vagrant
    8.2.3  使用VM
  8.3  Hadoop生態系統
    8.3.1  架構
    8.3.2  HDFS
    8.3.3  MapReduce
    8.3.4  YARN
  8.4  Spark
  8.5  小結
第9章  Spark機器學習實踐
  9.1  為本章設置虛擬機
  9.2  跨集群節點共享變數
    9.2.1  廣播只讀變數
    9.2.2  累加器只寫變數
    9.2.3  廣播和累加器的示例
  9.3  Spark的數據預處理
    9.3.1  JSON文件和Spark DataFrame
    9.3.2  處理缺失數據
    9.3.3  在內存中分組和創建表
    9.3.4  將預處理的DataFrame或RDD寫入磁碟
    9.3.5  使用Spark DataFrame
  9.4  Spark機器學習
    9.4.1  Spark處理KDD99數據集
    9.4.2  讀取數據集
    9.4.3  特徵工程
    9.4.4  訓練學習器
    9.4.5  評估學習器的表現
    9.4.6  機器學習管道的威力
    9.4.7  手動優化
    9.4.8  交叉驗證
  9.5  小結

附錄  介紹GPU和Theano

  • 商品搜索:
  • | 高級搜索
首頁新手上路客服中心關於我們聯絡我們Top↑
Copyrightc 1999~2008 美商天龍國際圖書股份有限公司 臺灣分公司. All rights reserved.
營業地址:臺北市中正區重慶南路一段103號1F 105號1F-2F
讀者服務部電話:02-2381-2033 02-2381-1863 時間:週一-週五 10:00-17:00
 服務信箱:bookuu@69book.com 客戶、意見信箱:cs@69book.com
ICP證:浙B2-20060032