幫助中心 | 我的帳號 | 關於我們

Python大數據分析與機器學習商業案例實戰

  • 作者:王宇韜//錢妍竹|責編:李華君
  • 出版社:機械工業
  • ISBN:9787111654711
  • 出版日期:2020/06/01
  • 裝幀:平裝
  • 頁數:392
人民幣:RMB 99.8 元      售價:
放入購物車
加入收藏夾

內容大鋼
    大數據分析與機器學習技術已成為各行各業實現數字化變革的關鍵驅動力。本書以功能強大且較易上手的Python語言為編程環境,全面講解了大數據分析與機器學習技術的商業應用實戰。
    全書共16章,講解了線性回歸模型、邏輯回歸模型、決策樹模型、樸素貝葉斯模型、K近鄰演算法模型、隨機森林模型、AdaBoost與GBDT模型、XGBoost與LightGBM模型、PCA(主成分分析)模型、聚類與分群模型(KMeans與DBSCAN演算法)、協同過濾演算法模型、Apriori關聯分析模型、神經網路模型等十余種機器學習模型的原理和代碼實現,每種模型都配有一到兩個典型案例,涵蓋金融、營銷、醫療、社會科學、企業辦公與管理等多個領域。
    本書適合具備一定數學知識和編程基礎、希望快速在工作中應用大數據分析與機器學習技術的讀者閱讀,也適合Python編程愛好者或對大數據分析與機器學習技術感興趣的讀者參考。

作者介紹
王宇韜//錢妍竹|責編:李華君

目錄
前言
如何獲取學習資源
第1章  Python與數據科學
  1.1  大數據分析與機器學習概述
    1.1.1  大數據分析與機器學習的應用領域
    1.1.2  機器學習的基本概念
    1.1.3  Python在數據科學中的作用
  1.2  Python編程環境部署與基本操作
    1.2.1  Python的安裝
    1.2.2  Pycharm的安裝與設置
    1.2.3  Jupyter Notebook的使用
  1.3  Python基礎知識概要
第2章  數據分析利器:NumPy、pandas與Matplotlib庫
  2.1  NumPy庫基礎
    2.1.1  NumPy庫與數組
    2.1.2  數組與列表的區別
    2.1.3  創建數組的幾種方式
  2.2  pandas庫基礎
    2.2.1  二維數據表格DataFrame的創建
    2.2.2  Excel工作簿等文件的讀取和寫入
    2.2.3  數據的選取與處理
    2.2.4  數據表拼接
  2.3  Matplotlib庫基礎
    2.3.1  基本圖表繪製
    2.3.2  數據可視化常用技巧
  2.4  案例實戰:股票數據讀取與K 線圖繪製
    2.4.1  初步嘗試:股票數據讀取與可視化
    2.4.2  進階實戰:股票K 線圖繪製
第3 章  線性回歸模型
  3.1  一元線性回歸
    3.1.1  一元線性回歸的數學原理
    3.1.2  一元線性回歸的代碼實現
    3.1.3  案例實戰:不同行業工齡與薪水的線性回歸模型
  3.2  線性回歸模型評估
    3.2.1  模型評估的編程實現
    3.2.2  模型評估的數學原理
  3.3  多元線性回歸
    3.3.1  多元線性回歸的數學原理和代碼實現
    3.3.2  案例實戰:客戶價值預測模型
第4 章  邏輯回歸模型
  4.1  邏輯回歸模型的演算法原理
    4.1.1  邏輯回歸模型的數學原理
    4.1.2  邏輯回歸模型的代碼實現
    4.1.3  邏輯回歸模型的深入理解
  4.2  案例實戰:客戶流失預警模型
    4.2.1  案例背景
    4.2.2  數據讀取與變數劃分
    4.2.3  模型的搭建與使用
  4.3  模型評估方法:ROC 曲線與KS 曲線
    4.3.1  ROC 曲線的基本原理

    4.3.2  案例實戰:用ROC 曲線評估客戶流失預警模型
    4.3.3  KS 曲線的基本原理
    4.3.4  案例實戰:用KS 曲線評估客戶流失預警模型
第5 章  決策樹模型
  5.1  決策樹模型的基本原理
    5.1.1  決策樹模型簡介
    5.1.2  決策樹模型的建樹依據
    5.1.3  決策樹模型的代碼實現
  5.2  案例實戰:員工離職預測模型
    5.2.1  模型搭建
    5.2.2  模型預測及評估
    5.2.3  決策樹模型可視化呈現及決策樹要點理解
  5.3  參數調優:K 折交叉驗證與GridSearch 網格搜索
    5.3.1  K 折交叉驗證
    5.3.2  GridSearch 網格搜索
第6 章  樸素貝葉斯模型
  6.1  樸素貝葉斯模型的演算法原理
    6.1.1  一維特徵變數下的貝葉斯模型
    6.1.2  二維特徵變數下的貝葉斯模型
    6.1.3  n 維特徵變數下的貝葉斯模型
    6.1.4  樸素貝葉斯模型的簡單代碼實現
  6.2  案例實戰:腫瘤預測模型
    6.2.1  案例背景
    6.2.2  數據讀取與劃分
    6.2.3  模型的搭建與使用
第7 章  K 近鄰演算法
  7.1  K 近鄰演算法的原理和代碼實現
    7.1.1  K 近鄰演算法的基本原理
    7.1.2  K 近鄰演算法的計算步驟
    7.1.3  K 近鄰演算法的代碼實現
  7.2  案例實戰:手寫數字識別模型
    7.2.1  案例背景
    7.2.2  手寫數字識別的原理
    7.2.3  手寫數字識別的代碼實現
  7.3  圖像識別原理詳解
第8 章  隨機森林模型
  8.1  隨機森林模型的原理和代碼實現
    8.1.1  集成模型簡介
    8.1.2  隨機森林模型的基本原理
    8.1.3  隨機森林模型的代碼實現
  8.2  案例實戰:股票漲跌預測模型
    8.2.1  股票基本數據獲取
    8.2.2  股票衍生變數生成
    8.2.3  多因子模型搭建
    8.2.4  模型使用與評估
    8.2.5  參數調優
    8.2.6  收益回測曲線繪製
第9 章  AdaBoost 與GBDT 模型
  9.1  AdaBoost 演算法原理
    9.1.1  AdaBoost 演算法的核心思想

    9.1.2  AdaBoost 演算法的數學原理概述
    9.1.3  AdaBoost 演算法的數學原理舉例
    9.1.4  AdaBoost 演算法的簡單代碼實現
  9.2  AdaBoost 演算法案例實戰:信用卡精準營銷模型
    9.2.1  案例背景
    9.2.2  模型搭建
    9.2.3  模型預測及評估
    9.2.4  模型參數介紹
  9.3  GBDT 演算法原理
    9.3.1  GBDT 演算法的核心思想
    9.3.2  GBDT 演算法的數學原理概述
    9.3.3  GBDT 演算法的數學原理舉例
    9.3.4  GBDT 演算法的簡單代碼實現
  9.4  GBDT 演算法案例實戰:產品定價模型
    9.4.1  案例背景
    9.4.2  模型搭建
    9.4.3  模型預測及評估
    9.4.4  模型參數介紹
第10 章  機器學習神器:XGBoost 與LightGBM 演算法
  10.1  XGBoost 演算法原理
    10.1.1  XGBoost 演算法的核心思想
    10.1.2  XGBoost 演算法的數學原理概述
    10.1.3  XGBoost 演算法的簡單代碼實現
  10.2  XGBoost 演算法案例實戰1:金融反欺詐模型
    10.2.1  案例背景
    10.2.2  模型搭建
    10.2.3  模型預測及評估
    10.2.4  模型參數調優
  10.3  XGBoost 演算法案例實戰2:信用評分卡模型
    10.3.1  案例背景
    10.3.2  多元線性回歸模型
    10.3.3  GBDT 回歸模型
    10.3.4  XGBoost 回歸模型
  10.4  LightGBM 演算法原理
    10.4.1  LightGBM 演算法的核心思想
    10.4.2  LightGBM 演算法的數學原理概述
    10.4.3  LightGBM 演算法的簡單代碼實現
  10.5  LightGBM 演算法案例實戰1:客戶違約預測模型
    10.5.1  案例背景
    10.5.2  模型搭建
    10.5.3  模型預測及評估
    10.5.4  模型參數調優
  10.6   LightGBM 演算法案例實戰2:廣告收益回歸預測模型
    10.6.1  案例背景
    10.6.2  模型搭建
    10.6.3  模型預測及評估
    10.6.4  模型參數調優
第11 章  特徵工程之數據預處理
  11.1  非數值類型數據處理
    11.1.1  Get_dummies 啞變數處理

    11.1.2  Label Encoding 編號處理
  11.2  重複值、缺失值及異常值處理
    11.2.1  重複值處理
    11.2.2  缺失值處理
    11.2.3  異常值處理
  11.3  數據標準化
    11.3.1  min-max 標準化
    11.3.2  Z-score 標準化
  11.4  數據分箱
  11.5  特徵篩選:WOE 值與IV 值
    11.5.1  WOE 值的定義與計算
    11.5.2  IV 值的定義與計算
    11.5.3  WOE 值與IV 值的代碼實現
    11.5.4  案例實戰:客戶流失預警模型的IV 值計算
  11.6  多重共線性的分析與處理
    11.6.1  多重共線性的定義
    11.6.2  多重共線性的分析與檢驗
  11.7  過採樣和欠採樣
    11.7.1  過採樣
    11.7.2  欠採樣
第12 章  數據降維之PCA
  12.1  數據降維
    12.1.1  PCA 的基本原理
    12.1.2  PCA 的代碼實現
  12.2  案例實戰:人臉識別模型
    12.2.1  案例背景
    12.2.2  人臉數據讀取、處理與變數提取
    12.2.3  數據劃分與降維
    12.2.4  模型的搭建與使用
  12.3  人臉識別外部介面調用
    12.3.1  baidu-aip 庫安裝
    12.3.2  調用介面進行人臉識別和打分
第13 章  數據聚類與分群分析
  13.1  KMeans 演算法
    13.1.1  KMeans 演算法的基本原理
    13.1.2  KMeans 演算法的代碼實現
    13.1.3  案例實戰:銀行客戶分群模型
  13.2  DBSCAN 演算法
    13.2.1  DBSCAN 演算法的基本原理
    13.2.2  DBSCAN 演算法的代碼實現
    13.2.3  KMeans 演算法與DBSCAN 演算法的對比
  13.3  案例實戰:新聞聚類分群模型
    13.3.1  案例背景
    13.3.2  文本數據的讀取與處理
    13.3.3  模型的搭建與使用
    13.3.4  模型優化
第14 章  智能推薦系統
  14.1  智能推薦系統的基本原理
    14.1.1  智能推薦系統的應用場景
    14.1.2  智能推薦系統的基礎:協同過濾演算法

  14.2  計算相似度的常用方法
    14.2.1  歐氏距離
    14.2.2  餘弦相似度
    14.2.3  皮爾遜相關係數
  14.3  案例實戰:電影智能推薦系統
    14.3.1  案例背景
    14.3.2  數據讀取與處理
    14.3.3  系統搭建
第15 章  關聯分析:Apriori 演算法
  15.1  關聯分析的基本概念和Apriori 演算法
    15.1.1  關聯分析的基本概念
    15.1.2  Apriori 演算法的數學演示
    15.1.3  Apriori 演算法的代碼實現
  15.2  案例實戰:病癥關聯規則分析
    15.2.1  案例背景
    15.2.2  數據讀取與處理
    15.2.3  關聯規則分析
第16 章  深度學習初窺之神經網路模型
  16.1  深度學習基礎:神經網路模型
    16.1.1  神經網路模型的基本原理
    16.1.2  神經網路模型的簡單代碼實現
  16.2  案例實戰:用戶評論情感分析模型
    16.2.1  案例背景
    16.2.2  數據讀取、中文分詞、文本向量化
    16.2.3  神經網路模型的搭建與使用

  • 商品搜索:
  • | 高級搜索
首頁新手上路客服中心關於我們聯絡我們Top↑
Copyrightc 1999~2008 美商天龍國際圖書股份有限公司 臺灣分公司. All rights reserved.
營業地址:臺北市中正區重慶南路一段103號1F 105號1F-2F
讀者服務部電話:02-2381-2033 02-2381-1863 時間:週一-週五 10:00-17:00
 服務信箱:bookuu@69book.com 客戶、意見信箱:cs@69book.com
ICP證:浙B2-20060032