幫助中心 | 我的帳號 | 關於我們

真實數據科學(負責任的數據分析與決策實踐)

  • 作者:(美)郁彬//麗貝卡·L.巴特|責編:王美玲//陳怡梅|譯者:常象宇//賈金柱//劉漢中//呂曉玲
  • 出版社:中國人民大學
  • ISBN:9787300337500
  • 出版日期:2025/09/01
  • 裝幀:平裝
  • 頁數:356
人民幣:RMB 96 元      售價:
放入購物車
加入收藏夾

內容大鋼
    本書以「真實數據科學(負責任的數據分析與決策實踐)」為核心視角,通過紮實且具實踐導向的內容,深入解析負責任的數據科學實踐路徑。從提出PCS框架(可預測性、可計算性、穩定性)切入,貫穿數據科學生命周期全流程,探究如何通過批判性思維和實證評估,確保數據分析結果的可信度,避免「數據窺探」和誤導性結論。
    同時,本書敏銳聚焦數據科學實踐中的關鍵環節,借助全球器官捐獻數據、美國農業部食物營養數據等真實案例,詳細演示數據清洗、探索性數據分析、模型構建等技術的實際應用,展現多重因素如何影響分析質量,以及如何通過嚴謹的全流程管理提升結果的可靠性。
    通過本書,讀者將深入理解數據科學實踐的核心邏輯,掌握解鎖負責任的數據分析與決策的有效方法,了解如何在複雜的真實數據場景中得出可信的結論,從而成為推動數據科學負責任應用的實踐者。

作者介紹
(美)郁彬//麗貝卡·L.巴特|責編:王美玲//陳怡梅|譯者:常象宇//賈金柱//劉漢中//呂曉玲

目錄
第1部分  簡介
  第1章  真實數據科學簡介
    1.1  數據和演算法在現實決策中的作用
    1.2  運用批判性思維評估和建立可信度
    1.3  使用PCS框架評估和建立可信度
    練習題
  第2章  數據科學生命周期
    2.1  數據術語
    2.2  DSLC階段1:問題構建和數據收集
    2.3  DSLC階段2:數據清洗、預處理和探索性數據分析
    2.4  DSLC階段3:探索數據的內在結構
    2.5  DSLC階段4:預測和/或推斷分析
    2.6  DSLC階段5:評估結果
    2.7  DSLC階段6:溝通結果和更新領域知識
    練習題
  第3章  建立數據科學項目
    3.1  編程語言和集成開發環境
    3.2  一致的項目結構
    3.3  可重複性
    3.4  協作工具
    練習題
第2部分  準備、探索和描述數據
  第4章  數據準備
    4.1  器官捐獻數據
    4.2  通用的數據清洗流程
    4.3  步驟1:了解數據收集過程和問題域
    4.4  步驟2:載入數據
    4.5  步驟3:檢查數據並創建操作項
    4.6  步驟4:清洗數據
    4.7  其他常見的預處理步驟
    練習題
  第5章  探索性數據分析
    5.1  基於問答的探索性數據分析工作流程
    5.2  常見的數據匯總方法
    5.3  可比性
    5.4  探索性數據分析結果的PCS審查
    練習題
  第6章  主成分分析
    6.1  食物營養項目
    6.2  生成歸納變數:主成分分析
    6.3  預處理:為了可比性的標準化
    6.4  奇異值分解
    6.5  預處理:高斯性和變換
    6.6  主成分分析步驟總結
    6.7  PCS評估主成分分析
    6.8  將主成分分析應用於每個營養組
    6.9  主成分分析的替代方法
    練習題
  第7章  聚類
    7.1  理解聚類

    7.2  層次聚類
    7.3  K-means聚類
    7.4  高維聚類可視化
    7.5  聚類質量的定量度量
    7.6  比較聚類相似性的蘭德指數
    7.7  選擇類別數
    7.8  聚類結果的PCS審查
    7.9  最終的聚類結果
    練習題
第3部分  預測
  第8章  預測問題簡介
    8.1  連接過去、現在和未來的預測問題
    8.2  設置預測問題
    8.3  PCS和評估預測演算法
    8.4  艾奧瓦州艾姆斯房價預測項目
    練習題
  第9章  連續響應和最小二乘法
    9.1  可視化預測關係
    9.2  使用擬合直線生成預測
    9.3  計算擬合直線
    9.4  預測性能的量化指標
    9.5  預測結果的PCS審查
    練習題
  第10章  最小二乘法的推廣
    10.1  基於多個解釋變數的線性擬合
    10.2  預處理:獨熱編碼
    10.3  預處理:變數變換
    10.4  變數選擇
    10.5  正則化
    10.6  PCS評估
    10.7  附錄:線性擬合的矩陣形式
    練習題
  第11章  二元響應變數和邏輯回歸
    11.1  在線購物購買預測項目
    11.2  二元預測的最小二乘法
    11.3  邏輯回歸
    11.4  二元預測性能的定量度量
    11.5  二元預測結果的PCS審查
    練習題
  第12章  決策樹和隨機森林演算法
    12.1  決策樹
    12.2  分類與回歸樹演算法
    12.3  隨機森林演算法
    12.4  隨機森林變數重要性度量
    12.5  CART和RF演算法的PCS評估
    練習題
  第13章  生成最終預測結果
    13.1  方法1:使用PCS選擇單一預測擬合
    13.2  方法2:PCS集成
    13.3  方法3:校準的PCS預測擾動區間

    13.4  選擇最終預測方法
    13.5  在實際應用中使用預測
    練習題
  第14章  結論
    14.1  可預測性
    14.2  穩定性和不確定性
    14.3  PCS的未來方向:推斷
    14.4  結束語
判斷練習參考答案
參考文獻

  • 商品搜索:
  • | 高級搜索
首頁新手上路客服中心關於我們聯絡我們Top↑
Copyrightc 1999~2008 美商天龍國際圖書股份有限公司 臺灣分公司. All rights reserved.
營業地址:臺北市中正區重慶南路一段103號1F 105號1F-2F
讀者服務部電話:02-2381-2033 02-2381-1863 時間:週一-週五 10:00-17:00
 服務信箱:bookuu@69book.com 客戶、意見信箱:cs@69book.com
ICP證:浙B2-20060032