幫助中心 | 我的帳號 | 關於我們

敏捷數據挖掘(CDA三級認證教材)

  • 作者:編者:CDA數據科學研究院|責編:張慧敏
  • 出版社:電子工業
  • ISBN:9787121516030
  • 出版日期:2026/01/01
  • 裝幀:平裝
  • 頁數:410
人民幣:RMB 109 元      售價:
放入購物車
加入收藏夾

內容大鋼
    本書作為CDA三級認證教材,打破了傳統的學院派知識整合模式,從業務應用場景出發來組織內容,旨在更加貼近業務需求,而非單純羅列演算法。經過多年的打磨,本書精選了在行業應用中價值最大的九類場景,並提供不同場景下構建數據應用的最佳實踐。本書涉及的演算法不僅涵蓋傳統的統計學習,還結合企業實際需求,解構了機器學習、深度學習的前沿方法,並提供了豐富的示例代碼,以便讀者借鑒。
    本書分為3篇:理論篇、技術篇和管理篇。理論篇共1章,講解數據挖掘的核心思維、演算法模型和數據挖掘之間的關係,以及數據挖掘的落地場景框架。技術篇共6章,講解決策類、識別類、優化分析類模型的具體演算法,以及參數調優、特徵工程、類別不平衡問題等內容。管理篇共2章,講解MLOps和模型生命周期管理。

作者介紹
編者:CDA數據科學研究院|責編:張慧敏
    CDA數據科學研究院,大數據行業方興未艾,CDA數據科學研究院孕育而生,是國內率先成立的專註于數據科學領域的專業研究團隊。CDA數據科學研究院彙集數據行業專家,團隊具有專業的學術素養、精湛的研究水平、紮實的企業實戰經驗,豐富的行業資源,通過對各類企業、社會組織等進行全面、系統、深入的調查和訪問,從而獲得緊跟技術發展的經驗與數據,並結合數據行業的未來發展方向進行系統的研究,不斷研發新的知識體系和技術應用。近十年來,CDA數據科學研究院秉持「專業性、前沿性、科學性」的定位,深耕數據分析、大數據、人工智慧等核心領域,持續推進數據科學的行業發展。未來,CDA數據科學研究院也將順應數字化時代浪潮,持續開拓創新,繼續加大數據科學領域的內容建設,推進人才數字化賦能,助力企業數字化轉型。

目錄
第1篇  原理篇
  第1章  進階數據分析思維
    1.1  數字化時代的三種重要思維
      1.1.1  設計思維
      1.1.2  敏捷思維
      1.1.3  數據思維
    1.2  數據思維在現代企業管理中的作用
      1.2.1  探查階段的數據分析
      1.2.2  定義階段的數據分析
      1.2.3  設計階段的數據分析
      1.2.4  交付階段的數據分析
  第2章  量化策略分析框架
    2.1  探索階段
    2.2  診斷階段
    2.3  指導階段
  第3章  量化策略分析流程
    3.1  發現問題
    3.2  近因分析
    3.3  根因分析
    3.4  做出預測
    3.5  制定方案
    3.6  驗證方案
    3.7  工具支持
第2篇  技術篇
  第4章  數據處理
    4.1  使用pandas讀取結構化數據
      4.1.1  讀取數據
      4.1.2  寫出數據
    4.2  數據整合
      4.2.1  行、列操作
      4.2.2  條件查詢
      4.2.3  橫向連接
      4.2.4  縱向合併
      4.2.5  排序
      4.2.6  分組匯總
      4.2.7  拆分列
      4.2.8  賦值與條件賦值
    4.3  數據清洗
      4.3.1  重複值處理
      4.3.2  缺失值處理
  第5章  數據可視化
    5.1  Python可視化
      5.1.1  Matplotlib繪圖庫
      5.1.2  Seaborn繪圖庫
    5.2  描述性統計分析與繪圖
      5.2.1  描述性統計進行數據探索
      5.2.2  製作報表與統計圖形
  第6章  市場調研與數據預處理
    6.1  數據採集方法
      6.1.1  市場研究中的數據

      6.1.2  概率抽樣方法
      6.1.3  非概率抽樣方法
      6.1.4  概率抽樣和非概率抽樣的比較
    6.2  市場調研和數據錄入
      6.2.1  市場調研流程
      6.2.2  市場調研目標設定
      6.2.3  市場調研前的準備工作
      6.2.4  實施調研
    6.3  數據預處理基礎
      6.3.1  數據預處理基本步驟
      6.3.2  錯誤數據識別與處理
      6.3.3  連續變數離群值識別與處理
      6.3.4  分類變數概化處理
      6.3.5  缺失值處理
      6.3.6  連續變數分佈形態轉換
      6.3.7  連續變數中心標準化或歸一化
      6.3.8  變數降維
      6.3.9  WoE轉換
  第7章  數據降維方法
    7.1  矩陣分析法
    7.2  連續變數降維
      7.2.1  方法概述
      7.2.2  變數篩選
      7.2.3  維度規約
    7.3  主成分分析法
      7.3.1  主成分分析簡介
      7.3.2  主成分分析原理
      7.3.3  主成分分析的運用
      7.3.4  實戰案例:在Python中實現主成分分析
      7.3.5  基於主成分的冗余變數篩選
    7.4  因子分析法
      7.4.1  因子分析模型
      7.4.2  因子分析演算法
      7.4.3  實戰案例:在Python中實現因子分析
  第8章  使用統計學方法進行檢驗和預測
    8.1  假設檢驗
      8.1.1  假設檢驗的基本原理
      8.1.2  假設檢驗中的兩類錯誤
      8.1.3  假設檢驗與區間估計的聯繫
      8.1.4  假設檢驗的基本步驟
      8.1.5  配對樣本t檢驗
    8.2  方差分析
      8.2.1  單因素方差分析
      8.2.2  多因素方差分析
    8.3  列聯表分析與卡方檢驗
      8.3.1  列聯表
      8.3.2  卡方檢驗
    8.4  線性回歸
      8.4.1  簡單線性回歸
      8.4.2  多元線性回歸

      8.4.3  多元線性回歸的變數篩選
      8.4.4  線性回歸模型的經典假設
      8.4.5  建立線性回歸模型的基本步驟
    8.5  邏輯回歸
      8.5.1  邏輯回歸的相關關係分析
      8.5.2  邏輯回歸模型及實現
      8.5.3  邏輯回歸的極大似然估計
      8.5.4  模型評估
      8.5.5  因果推斷模型
  第9章  用戶分群方法
    9.1  用戶細分與聚類
      9.1.1  用戶細分的重要意義
      9.1.2  用戶細分的不同商業主題
    9.2  聚類分析的基本概念
    9.3  聚類模型的評估
      9.3.1  輪廓係數
      9.3.2  平方根標準誤差
      9.3.3  R2 2499.3.4ARI
    9.4  層次聚類
      9.4.1  層次聚類演算法描述
      9.4.2  層次聚類分群數量的確定
      9.4.3  層次聚類應用簡單示例
      9.4.4  層次聚類的特點
    9.5  K-means聚類演算法
      9.5.1  K-means聚類演算法描述
      9.5.2  K-means聚類演算法的應用:用戶細分
    9.6  聚類事後分析:決策樹應用
      9.6.1  決策樹的基本概念
      9.6.2  利用決策樹解讀用戶分群后的特徵
第3篇  管理篇
  第10章  企業數據管理方法論
    10.1  基本概念和關鍵術語解析
      10.1.1  背景與目標
      10.1.2  數據管理主要模塊及其關係
      10.1.3  數據生存周期管理
    10.2  輸入和資源需求
      10.2.1  業務戰略
      10.2.2  組織文化
      10.2.3  架構設計和IT系統現狀說明
    10.3  數據治理流程
      10.3.1  「盤」:盤清現狀
      10.3.2  「規」:制定規範
      10.3.3  「治」:問題整治
      10.3.4  「用」:數據應用
    10.4  輸出和績效評估
      10.4.1  數據管理的輸出
      10.4.2  數據管理的績效評估
    10.5  數據管理的成熟度模型
      10.5.1  能力域和能力項
      10.5.2  成熟度評估等級

    10.6  數據資產價值評估與數據資源入表
      10.6.1  數據資產價值評估方法
      10.6.2  數據資源入表
    10.7  本章小結
  第11.章  企業數據安全管理方法論
    11.1  數據安全導論
      11.1.1  數據安全需求
      11.1.2  數據安全定義
      11.1.3  數據安全管理目標和原則
    11.2  輸入和資源需求
      11.2.1  業務需求
      11.2.2  監管要求
    11.3  數據生存周期安全管理流程
      11.3.1  數據安全需求分析
      11.3.2  制定數據安全制度和細則
      11.3.3  數據的分類分級
      11.3.4  數據安全實施控制
    11.4  輸出和績效評估
      11.4.1  數據安全的輸出
      11.4.2  數據安全的績效評估
    11.5  數據安全能力成熟度模型
    11.6  本章小結

  • 商品搜索:
  • | 高級搜索
首頁新手上路客服中心關於我們聯絡我們Top↑
Copyrightc 1999~2008 美商天龍國際圖書股份有限公司 臺灣分公司. All rights reserved.
營業地址:臺北市中正區重慶南路一段103號1F 105號1F-2F
讀者服務部電話:02-2381-2033 02-2381-1863 時間:週一-週五 10:00-17:00
 服務信箱:bookuu@69book.com 客戶、意見信箱:cs@69book.com
ICP證:浙B2-20060032