幫助中心 | 我的帳號 | 關於我們

Python數據挖掘實戰

  • 作者:方小敏|責編:張月萍
  • 出版社:電子工業
  • ISBN:9787121404610
  • 出版日期:2021/02/01
  • 裝幀:平裝
  • 頁數:233
人民幣:RMB 79 元      售價:
放入購物車
加入收藏夾

內容大鋼
    本書從解決工作上的實際問題出發,提煉總結了日常工作中常用的數據挖掘實戰方法與技巧,並且使用Python語言來實現。本書力求通俗易懂地介紹相關知識,盡可能避免使用晦澀難懂的統計術語或模型公式去講解每個演算法的原理。而且在每個演算法的後面演示一個實用的案例,方便大家理解和掌握每種演算法的使用。
    本書的定位是帶領使用Python語言的數據挖掘初學者入門,並能解決學習、工作中大部分的問題或需求。讀者入門后若還需要進一步學習,可自行擴展閱讀相關書籍或資料。學習是永無止境的,正所謂「師傅領進門,修行在個人。」

作者介紹
方小敏|責編:張月萍
    方小敏,「數據分析實戰」公眾號主理人,資深機器學習工程師;曾服務於BAT等知名互聯網企業,熟練掌握Python、R、Spark、Hive、TensorFlow等工具進行機器學習。

目錄
第1章  數據挖掘基礎
  1.1  數據挖掘是什麼
    1.1.1  數據挖掘演算法的類型
    1.1.2  數據挖掘需要的技能
    1.1.3  數據挖掘的常見誤區
  1.2  數據挖掘的常見問題
    1.2.1  預測問題
    1.2.2  分類問題
    1.2.3  聚類問題
    1.2.4  關聯問題
  1.3  數據挖掘的標準流程
    1.3.1  商業理解
    1.3.2  數據理解
    1.3.3  數據準備
    1.3.4  模型構建
    1.3.5  模型評估
    1.3.6  模型部署
  1.4  數據分析和數據挖掘的區別
    1.4.1  數據分析
    1.4.2  數據挖掘
第2章  回歸模型
  2.1  回歸模型簡介
  2.2  相關分析
    2.2.1  依存關係
    2.2.2  相關係數的計算
    2.2.3  相關係數的方向與大小
    2.2.4  居民購物習慣相關分析案例
  2.3  簡單線性回歸分析
    2.3.1  線性回歸方程解讀
    2.3.2  使用最小二乘法求解回歸方程
    2.3.3  使用廣告投放費用預測銷售額案例
  2.4  多重線性回歸分析
    2.4.1  使用最小二乘法求解多重線性回歸方程
    2.4.2  使用廣告投放費用與客流量預測銷售額案例
  2.5  一元非線性回歸
    2.5.1  一元非線性回歸模型
    2.5.2  一元非線性回歸模型求解
    2.5.3  使用上線天數預測活躍用戶數案例
第3章  分類模型
  3.1  分類模型基礎
    3.1.1  分類模型的建模五步驟
    3.1.2  分類模型評估指標
    3.1.3  K折交叉驗證
  3.2  KNN模型
    3.2.1  KNN模型原理
    3.2.2  使用商戶數據預測是否續約案例
  3.3  貝葉斯分類
    3.3.1  貝葉斯分類的核心概念
    3.3.2  樸素貝葉斯分類
    3.3.3  樸素貝葉斯分類演算法在離散型特徵上的求解

    3.3.4  樸素貝葉斯分類演算法在連續型特徵上的求解
    3.3.5  使用議員在議案上的投票記錄預測其所屬黨派案例
    3.3.6  根據商戶數據預測其是否續約案例
    3.3.7  根據新聞文本預測其所屬分類案例
  3.4  決策樹
    3.4.1  決策樹分類
    3.4.2  決策樹分類演算法原理
    3.4.3  使用高中生基本信息預測其是否計劃升學案例
    3.4.4  案例解讀
  3.5  隨機森林
    3.5.1  隨機森林的特點
    3.5.2  網格搜索
    3.5.3  使用隨機森林演算法提升決策樹演算法效果案例
  3.6  支持向量機
    3.6.1  支持向量機的核心原理
    3.6.2  根據葡萄酒成分數據預測其分類案例
  3.7  邏輯回歸
    3.7.1  邏輯回歸的核心概念
    3.7.2  邏輯回歸的數學推導
    3.7.3  使用住戶信息預測房屋是否屋主所有案例
第4章  特徵工程
  4.1  描述性統計分析
  4.2  數據標準化
    4.2.1  Min-Max標準化
    4.2.2  Z-Score 標準化
    4.2.3  Normalizer歸一化
  4.3  數據變換
    4.3.1  二值化
    4.3.2  分桶
    4.3.3  冪變換
  4.4  缺失值處理
    4.4.1  刪除缺失值所在的行
    4.4.2  均值/眾數/中值填充
    4.4.3  模型填充
  4.5  降維
    4.5.1  主成分分析
    4.5.2  因子分析
第5章  聚類演算法
  5.1  K均值演算法
    5.1.1  K均值演算法的核心概念
    5.1.2  電信套餐制定案例
  5.2  DBSCAN演算法
    5.2.1  DBSCAN演算法核心概念
    5.2.2  用戶常活動區域挖掘案例
  5.3  層次聚類演算法
    5.3.1  演示:聚類層次的計算過程
    5.3.2  基於運營商基站信息挖掘商圈案例
第6章  關聯演算法
  6.1  關聯規則
    6.1.1  關聯規則的核心概念

    6.1.2  超市關聯規則挖掘案例
    6.1.3  超市關聯規則解讀
  6.2  協同過濾
    6.2.1  協同過濾演算法的實現
    6.2.2  安裝scikit-surprise模塊
    6.2.3  基於電影數據的協同過濾案例
  6.3  奇異值分解
第7章  時間序列
  7.1  時間序列分解
    7.1.1  非季節性時間序列分解
    7.1.2  季節性時間序列
  7.2  序列預測
    7.2.1  把不平穩的時間序列轉換成平穩的時間序列
    7.2.2  自回歸模型
    7.2.3  移動平均模型
    7.2.4  自回歸移動平均模型
第8章  模型持久化
  8.1  保存模型
  8.2  恢復模型
  8.3  管道模型

  • 商品搜索:
  • | 高級搜索
首頁新手上路客服中心關於我們聯絡我們Top↑
Copyrightc 1999~2008 美商天龍國際圖書股份有限公司 臺灣分公司. All rights reserved.
營業地址:臺北市中正區重慶南路一段103號1F 105號1F-2F
讀者服務部電話:02-2381-2033 02-2381-1863 時間:週一-週五 10:00-17:00
 服務信箱:bookuu@69book.com 客戶、意見信箱:cs@69book.com
ICP證:浙B2-20060032