幫助中心 | 我的帳號 | 關於我們

統計分析(從小數據到大數據)/CDA數據分析師系列叢書

  • 作者:丁亞軍
  • 出版社:電子工業
  • ISBN:9787121377532
  • 出版日期:2020/01/01
  • 裝幀:平裝
  • 頁數:240
人民幣:RMB 79 元      售價:
放入購物車
加入收藏夾

內容大鋼
    面對小數據和大數據,數據分析師應該如何收集數據信息?傳統的業務框架如何與統計學相關聯?測量學扮演著什麼角色?建模過程有哪些預分析技術和修正技術?建模工作完成後,如何解析?如何歸因?如何預測?等等,這些數據分析能力構成了本書的分析框架。
    本書分為8章,小數據與大數據分析模式的動態切換貫穿全書,展示了數據分析案例的模塊化分析思路。第1?3章為數據預分析部分,強調業務問題與統計問題的銜接;第4?6章為統計建模階段,其中附有對行業案例和業務敏感度的訓練、對統計和業務整合的審美建議,進而構造出一套具有靈活調校的數據分析模式。第7?8章解決的問題是,如何將晦澀難懂的統計解釋轉換成業務解釋。
    由衷地希望本書能夠成為數據運營人員與初中級數據分析師分析數據的行動指南。

作者介紹
丁亞軍
    丁亞軍,自由職業者,兼CDA數據科學研究院研究員、電子工業出版社大數據專家委員會成員、學習路徑圖國際技術中心顧問、經管之家培訓中心講師。研究方向:統計軟體與數據分析、市場調查研究、電商CRM數據挖掘、銀行申請與行為評分卡。

目錄
第1部分  數據分析準備
  第1章  從業務到統計
    1.1  業務需求從哪來
      1.1.1  學習業務的最快途徑:閱讀運營報告
      1.1.2  當務之急:研究痛點
      1.1.3  數據分析之錨:未來戰略方向
      1.1.4  對數據分析「小白」的有益建議
    1.2  從小數據到大數據:數據體量與信息分佈
      1.2.1  實驗室:理論驗證
      1.2.2  問卷:理論驗證+探索
      1.2.3  資料庫:業務驗證+探索
      1.2.4  數據信息與統計模型
      1.2.5  演算法應用:是否跨界
      1.2.6  演算法特徵:角色
    1.3  數據分析流程的啟示
      1.3.1  假設:驗證與歸因
      1.3.2  小概率:黑天鵝的不確定
      1.3.3  抽樣技術:經濟是根本
      1.3.4  選擇模型:方法論
      1.3.5  顯著性判斷:可證偽
  第2章  變數角色與描述
    2.1  如何描述變數
      2.1.1  分類變數與連續變數的分界線
      2.1.2  分類變數及可視化
      2.1.3  連續變數及可視化
    2.2  因變數的測量
      2.2.1  測量級別問題
      2.2.2  是否存在測量誤差
      2.2.3  誰會成為「主角」
      2.2.4  y的量化場景
    2.3  自變數的選擇
      2.3.1  驗證性:x的選擇
      2.3.2  探索性:x的選擇
  第3章  數據預分析
    3.1  填補缺失
      3.1.1  描述缺失數據:行、列、單元格
      3.1.2  缺失類型:隨機性
      3.1.3  小數據填補方案:精確性探討
      3.1.4  大數據填補方案:速度問題探討
    3.2  處理異常值
      3.2.1  單變數與雙變數異常
      3.2.2  無監督異常:聚類分析
      3.2.3  監督異常:回歸殘差分析
      3.2.4  小數據與大數據如何看待異常值
    3.3  消除共線性
      3.3.1  共線性及其危害
      3.3.2  小數據的方案:嶺回歸
      3.3.3  大數據方案:項目合併與逐步回歸
    3.4  內生性問題
      3.4.1  內生性及其危害

      3.4.2  問題核心:特徵選擇
      3.4.3  三駕馬車之一:資料庫的應對策略
    3.5  變數變換技術
      3.5.1  正態分佈變換:對數變換
      3.5.2  從0到1:老闆最喜歡的符號%
      3.5.3  強異常值:秩的應用
      3.5.4  量綱:標準化變換
    3.6  編碼技術
      3.6.1  為什麼需要分箱化
      3.6.2  分箱技術要義:數據拐點
    3.7  避免過擬合
      3.7.1  導致過擬合:行列問題
      3.7.2  小數據為什麼不談過擬合
      3.7.3  避免過擬合:方法學
第2部分  構建模型與修正技術
  第4章  線性回歸與統計家族
    4.1  差異性問題:方差分析
      4.1.1  差異的來源:主效應
      4.1.2  差異的來源:交互效應
      4.1.3  交互性解釋:交互效應圖製作
    4.2  結構性問題:回歸分析
      4.2.1  回歸分析流程
      4.2.2  相關的風向標作用:文氏圖
      4.2.3  偏相關的歸因:中介和調節
      4.2.4  回歸係數解釋:偏回歸圖
      4.2.5  如何相信R2
      4.2.6  以殘差看假設
      4.2.7  殘差信息的有和無
      4.2.8  小數據需求歸納:重結構輕預測
    4.3  演算法進化REG:小數據專家的努力
      4.3.1  演算法1.0:精確度+結構
      4.3.2  演算法2.0:精確度+結構與預測
      4.3.3  演算法3.0:速度+預測
      4.3.4  演算法4.0:加速度
  第5章  Logistic回歸與統計家族
    5.1  預測性問題:Logistic回歸
      5.1.1  卡方的風向標作用
      5.1.2  不一樣的R2:預測分類表
      5.1.3  回歸係數解釋:or值與rr值
      5.1.4  修正技術:是x而不是y
      5.1.5  大數據需求歸納:輕結構重預測
    5.2  演算法進化Logistic:大數據與智能
      5.2.1演算法1.0:穩定性+結構
      5.2.2演算法2.0:穩定性+結構與預測
      5.2.3演算法3.0:速度+預測
      5.2.4演算法4.0:加速度
    5.3  演算法3.0的榜樣:神經網路
      5.3.1  神經網路演算法
      5.3.2  DM演算法預分析
      5.3.3  基於神經網路的常規應用

  第6章  降維技術
    6.1  主成分回歸與壓縮技術
      6.1.1  四駕馬車:實驗室、問卷、資料庫、雲
      6.1.2  主成分演算法:降維
      6.1.3  主成分與因子:誰應該有名字?
      6.1.4  主成分回歸:「回歸+回歸」模式
    6.2  對應分析:一個市場調查案例
      6.2.1  案例背景介紹
      6.2.2  模型預分析
      6.2.3  構建模型:「廣義」雙標圖
      6.2.4  結論及營銷
第3部分  模型應用與評估
  第7章  回歸類模型應用
    7.1  結構性問題:偏回歸係數
      7.1.1  單結構:偏的意義
      7.1.2  整體結構:條件規則
    7.2  預測性問題:估計值
      7.2.1  老樣本預測:內衍與市場細分
      7.2.2  新樣本預測:外推與潛在行為
    7.3  模型優劣與模型評價
      7.3.1  R2變形記
      7.3.2  圖示R2:R2圖與ROC曲線
    7.4  模型優劣與業務評價
      7.4.1  小數據的標準:R2
      7.4.2  大數據的標準:老闆
  第8章  數據分析報告
    8.1  可視化圖形製作
      8.1.1  條形圖與折線圖
      8.1.2  頻數與分佈
      8.1.3  多變箱體圖
      8.1.4  散點圖與氣泡圖
    8.2  圖形製作與格式
      8.2.1  圖形製作:繪圖、顏色
      8.2.2  圖形模板製作與調用
    8.3  表格製作與格式
      8.3.1  表格製作:製表、格式
      8.3.2  表格模板製作與調用
      8.3.3  OMS控制面板
附錄A  數據集

  • 商品搜索:
  • | 高級搜索
首頁新手上路客服中心關於我們聯絡我們Top↑
Copyrightc 1999~2008 美商天龍國際圖書股份有限公司 臺灣分公司. All rights reserved.
營業地址:臺北市中正區重慶南路一段103號1F 105號1F-2F
讀者服務部電話:02-2381-2033 02-2381-1863 時間:週一-週五 10:00-17:00
 服務信箱:bookuu@69book.com 客戶、意見信箱:cs@69book.com
ICP證:浙B2-20060032