幫助中心 | 我的帳號 | 關於我們

Python機器學習案例教程(原書第2版)/大數據叢書

  • 作者:(英)劉宇熙|責編:劉琴琴|譯者:強彥//趙涓涓
  • 出版社:機械工業
  • ISBN:9787111677109
  • 出版日期:2021/05/01
  • 裝幀:平裝
  • 頁數:233
人民幣:RMB 89 元      售價:
放入購物車
加入收藏夾

內容大鋼
    本書包括3部分:第1部分介紹機器學習的基本概念,它們是機器學習的預備知識;第2部分系統介紹幾種成熟的機器學習演算法和技術;第3部分介紹貫穿整個機器學習工作流程的21個最佳案例,並且討論具有前瞻性的方法和想法,它們被公認為是機器學習未來的研究重點。本書中的代碼均在Python 3中測試通過。
    本書適合高等院校相關專業的大學生、研究生或教師閱讀學習,以及不具有機器學習或統計背景但是想要快速補充機器學習演算法知識,以便在實際產品或平台中應用的軟體工程師。

作者介紹
(英)劉宇熙|責編:劉琴琴|譯者:強彥//趙涓涓

目錄
譯者序
前言
第1部分  機器學習的基礎
  第1章  機器學習和Python入門
    1.1  超高水平的機器學習技術概述
      1.1.1  機器學習任務的分類
      1.1.2  機器學習演算法的發展簡史
    1.2  機器學習的核心——數據泛化
      1.2.1  過擬合、欠擬合和偏差-方差權衡
      1.2.2  利用交叉驗證避免過擬合
      1.2.3  利用正則化避免過擬合
      1.2.4  通過特徵選擇和降維避免過擬合
    1.3  預處理、探索和特徵工程
      1.3.1  缺失值
      1.3.2  標籤編碼
      1.3.3  獨熱編碼
      1.3.4  縮放
      1.3.5  多項式特徵
      1.3.6  冪變換
      1.3.7  分箱
    1.4  組合模型
      1.4.1  投票法和平均法
      1.4.2  裝袋法
      1.4.3  提升方法
      1.4.4  堆疊法
    1.5  安裝軟體和設置
      1.5.1  設置Python和環境
      1.5.2  安裝各種軟體包
    本章小結
    習題
第2部分  Python機器學習實例
  第2章  使用文本分析技術研究20組新聞數據集
    2.1  電腦如何理解語言——NLP
    2.2  瀏覽NLP庫並學習NLP基礎知識
      2.2.1  語料庫
      2.2.2  標記
      2.2.3  詞性
      2.2.4  命名實體識別
      2.2.5  詞幹提取和詞形還原
      2.2.6  語義和主題建模
    2.3  獲取新聞組數據
    2.4  研究新聞組數據
    2.5  考慮文本數據的特性
      2.5.1  計算每個單詞表徵的出現次數
      2.5.2  文本預處理
      2.5.3  丟棄停止詞
      2.5.4  詞幹提取和詞形還原法
    2.6  使用t-SNE可視化新聞組數據
      2.6.1  什麼是降維
      2.6.2  用於降維的t-SNE

    本章小結
    習題
  第3章  使用聚類和主題建模演算法挖掘20組新聞數據集
    3.1  沒有指導的學習——無監督學習
    3.2  使用k均值聚類演算法對新聞數據集進行聚類
      3.2.1  k均值聚類演算法是如何聚類的
      3.2.2  從頭實現k均值聚類演算法
      3.2.3  用機器學習實現后均值聚類演算法
      3.2.4  k值的選擇
      3.2.5  使用k均值聚類新聞組數據
    3.3  在新聞組中發現基礎主題
    3.4  使用NMF進行主題建模
    3.5  使用LDA進行主題建模
    本章小結
    習題
  第4章  使用樸素貝葉斯檢測垃圾郵件
    4.1  從分類開始
      4.1.1  分類演算法的類型
      4.1.2  文本分類的應用
    4.2  探索樸素貝葉斯
      4.2.1  通過案例來學習貝葉斯定理
      4.2.2  樸素貝葉斯的結構
      4.2.3  運用scratch庫實現樸素貝葉斯分類器
      4.2.4  運用scikit-learn庫實現樸素貝葉斯分類器
    4.3  分類性能評估
    4.4  模型調優和交叉驗證
    本章小結
    習題
  第5章  使用支持向量機對新聞組主題進行分類
    5.1  用支持向量機尋找分離邊界
      5.1.1  通過不同的示例了解支持向量機如何工作
      5.1.2  實現支持向量機
      5.1.3  支持向量機的核心
      5.1.4  在線性核和RBF核之間進行選擇
    5.2  使用支持向量機對新聞組主題進行分類
    5.3  更多示例——心臟造影的胎兒狀態分類
    5.4  另一個示例——使用TensorFlow完成基於支持向量機的乳腺癌分類
    本章小結
    習題
  第6章  使用基於樹的演算法預測在線廣告點擊率
    6.1  廣告點擊率預測概述
    6.2  兩種類型數據:數值型和分類型
    6.3  從根到葉探索決策樹
      6.3.1  構建決策樹
      6.3.2  衡量分裂的標準
    6.4  從頭實現決策樹
    6.5  用決策樹預測廣告點擊率
    6.6  集成決策樹——隨機森林
      6.6.1  使用TensorFlow實現隨機森林
    本章小結

    習題
  第7章  使用邏輯回歸預測在線廣告點擊率
    7.1  將分類特徵轉換為數字特徵——獨熱編碼和順序編碼
    7.2  用邏輯回歸對數據進行分類
      7.2.1  邏輯函數入門
      7.2.2  從邏輯函數到邏輯回歸
    7.3  訓練邏輯回歸模型
      7.3.1  利用梯度下降訓練邏輯回歸模型
      7.3.2  利用梯度下降的邏輯回歸模型預測在線廣告點擊率
      7.3.3  利用隨機梯度下降訓練邏輯回歸模型
      7.3.4  利用正則化訓練邏輯回歸模型
    7.4  通過在線學習訓練大型數據集
    7.5  處理多元分類
    7.6  使用TensorFlow實現邏輯回歸
    7.7  使用隨機森林進行特徵選擇
    本章小結
    習題
  第8章  將預測擴展到TB級點擊日誌
    8.1  學習Apache Spark的基本知識
      8.1.1  了解Spark
      8.1.2  安裝Spark
      8.1.3  啟動和部署Spark程序
    8.2  在PySpark中編程
    8.3  使用Spark學習大量點擊日誌
      8.3.1  載入點擊日誌
      8.3.2  拆分和緩存數據
      8.3.3  對分類特徵進行獨熱編碼
      8.3.4  訓練和測試邏輯回歸模型
    8.4  使用Spark對分類變數進行特徵工程
      8.4.1  散列分類特徵
      8.4.2  組合多個變數——特徵交互
    本章小結
    習題
  第9章  使用回歸演算法預測股票價格
    9.1  有關股票市場和股票價格的簡要概述
    9.2  什麼是回歸
    9.3  獲取股價數據
      9.3.1  開始特徵工程
      9.3.2  獲取數據並生成特徵
    9.4  使用線性回歸來估計
      9.4.1  線性回歸是如何工作的
      9.4.2  實現線性回歸
    9.5  使用回歸樹進行預測
      9.5.1  從分類樹到回歸樹
      9.5.2  實現回歸樹
      9.5.3  實現隨機森林
    9.6  用支持向量回歸機進行評估
      9.6.1  實現支持向量回歸機
    9.7  用神經網路進行估算
      9.7.1  揭開神經網路的神秘面紗

      9.7.2  實現神經網路
    9.8  評估回歸性能
    9.9  使用四種回歸演算法預測股票價格
    本章小結
    習題
第3部分  Python機器學習最佳案例
  第10章  機器學習最佳案例
    10.1  機器學習解決方案流程
    10.2  數據準備階段的最佳案例
      10.2.1  最佳案例1——完全理解項目目標
      10.2.2  最佳案例2——收集所有相關的特徵
      10.2.3  最佳案例3——保持特徵值的一致性
      10.2.4  最佳案例4——處理缺失數據
      10.2.5  最佳案例5——存儲大規模數據
    10.3  訓練集生成階段的最佳案例
      10.3.1  最佳案例6——區分分類型特徵與數值型特徵
      10.3.2  最佳案例7——決定是否要對分類型特徵進行編碼
      10.3.3  最佳案例8——決定是否要選擇特徵和如何選擇
      10.3.4  最佳案例9——決定是否要降維和如何降維
      10.3.5  最佳案例10——決定是否重新調整特徵取值
      10.3.6  最佳案例11——在擁有專業知識的條件下進行特徵工程
      10.3.7  最佳案例12——在缺少專業知識的條件下進行特徵工程
      10.3.8  最佳案例13——記錄每個特徵是如何生成的
      10.3.9  最佳案例14——從文本數據中提取特徵
    10.4  模型訓練、評估和選擇階段的最佳案例
      10.4.1  最佳案例15——選擇合適的起步演算法
      10.4.2  最佳案例16——減少過擬合
      10.4.3  最佳案例17——識別過擬合與欠擬合
      10.4.4  最佳案例18——在大型數據集上建模
    10.5  部署和監視階段的最佳案例
      10.5.1  最佳案例19——保存、載入和重用模型
      10.5.2  最佳案例20——監控模型性能
      10.5.3  最佳案例21——定期更新模型
    本章小結
    習題

  • 商品搜索:
  • | 高級搜索
首頁新手上路客服中心關於我們聯絡我們Top↑
Copyrightc 1999~2008 美商天龍國際圖書股份有限公司 臺灣分公司. All rights reserved.
營業地址:臺北市中正區重慶南路一段103號1F 105號1F-2F
讀者服務部電話:02-2381-2033 02-2381-1863 時間:週一-週五 10:00-17:00
 服務信箱:bookuu@69book.com 客戶、意見信箱:cs@69book.com
ICP證:浙B2-20060032