幫助中心 | 我的帳號 | 關於我們

數據科學導論(探索數據的奧秘第2版教育部高等學校電工電子基礎課程教學指導分委員會推薦教材)

  • 作者:編者:黃曉林|責編:文怡
  • 出版社:清華大學
  • ISBN:9787302696476
  • 出版日期:2025/07/01
  • 裝幀:平裝
  • 頁數:194
人民幣:RMB 49 元      售價:
放入購物車
加入收藏夾

內容大鋼
    本書從數據科學的「科學」性出發,著重介紹數據科學項目的規範化流程以及各步驟所涉及的數據科學基本概念與原理。全書共包含六大部分:問題與目標、數據獲取、Python基礎、探索性數據分析、建模與性能評估、結果展示。
    本書可作為大專院校數據科學相關專業的導論性教材或參考書,也適合所有對數據科學感興趣的學生和社會讀者自學。本書配套的慕課「探索數據的奧秘」已在中國大學MOOC網上線。

作者介紹
編者:黃曉林|責編:文怡

目錄
第1章  緒論
  1.1  為什麼要研究數據科學
  1.2  基本概念
    1.2.1  數據
    1.2.2  大數據
    1.2.3  數據科學
  1.3  數據科學項目涉及的人員及其任務
  1.4  數據科學項目流程
    1.4.1  確定問題
    1.4.2  制定目標
    1.4.3  搜集數據
    1.4.4  探索性數據分析
    1.4.5  建立模型
    1.4.6  性能評價
    1.4.7  結果展示
    1.4.8  部署模型
  1.5  數據科學項目中的數據流
  1.6  本書內容、採用工具和目標人群
  思考題
第2章  問題與目標
  2.1  用戶層面的問題與目標
  2.2  數據科學層面的問題與目標
  思考題
第3章  數據獲取
  3.1  前提假設與數據方案設計
    3.1.1  前提假設
    3.1.2  數據方案設計
    3.1.3  數據獲取的可行性分析
    3.1.4  確定數據構成
  3.2  總體和抽樣
    3.2.1  總體和個體
    3.2.2  樣本
    3.2.3  無偏抽樣
    3.2.4  抽樣偏差
  3.3  混雜因素及其避免方法
    3.3.1  混雜因素和辛普森悖論
    3.3.2  隨機控制實驗
    3.3.3  自然實驗
  思考題
第4章  Python基礎
  4.1  Python的下載與安裝
  4.2  常用工具包的下載與安裝
  4.3  Jupyter Notebook
  4.4  Python常用數據結構
    4.4.1  列表
    4.4.2  元組
    4.4.3  字典
    4.4.4  集合
    4.4.5  numpy.ndarray
    4.4.6  Pandas.DataFrame

  4.5  Python基本語法
    4.5.1  基本命令
    4.5.2  控制流和相關語法
  4.6  Python數據導入
    4.6.1  本地數據導入
    4.6.2  在線數據導入
    4.6.3  數據的連續流載入
第5章  探索性數據分析
  5.1  數據檢查
    5.1.1  數據的意義及規模
    5.1.2  特徵的數據類型及意義
    5.1.3  初步排除數據泄露
  5.2  數據預處理
    5.2.1  缺失處理
    5.2.2  異常處理
    5.2.3  冗余處理
  5.3  描述性統計
    5.3.1  位置性測度
    5.3.2  離散性測度
    5.3.3  圖形化描述統計
  思考題
第6章  建模與性能評價
  6.1  統計建模
    6.1.1  常見的概率密度函數
    6.1.2  參數估計
    6.1.3  假設檢驗
    6.1.4  p-hacking
    6.1.5  統計模型的應用場景
  6.2  回歸模型
    6.2.1  線性回歸模型
    6.2.2  線性回歸模型性能評價
    6.2.3  線性回歸與線性相關
    6.2.4  多元線性回歸
    6.2.5  線性回歸模型的適用場合
    6.2.6  Logistic回歸
    6.2.7  訓練集-測試集劃分
    6.2.8  應用非數值特徵作為輸入時的one-hot編碼
    6.2.9  邏輯回歸模型的適用場合
  6.3  樸素貝葉斯模型
    6.3.1  貝葉斯定理
    6.3.2  高斯模型
    6.3.3  多項式模型
    6.3.4  伯努利模型
  6.4  分類模型的性能評價
    6.4.1  混淆矩陣
    6.4.2  指標權衡
    6.4.3  應用舉例
    6.4.4  參數區分性能評價
  6.5  決策樹
    6.5.1  決策樹工作原理

    6.5.2  分類任務決策樹的建模過程
    6.5.3  分類決策樹應用舉例
  6.6  人工神經網路
    6.6.1  人工神經網路的基本概念和工作原理
    6.6.2  人工神經網路的應用舉例
    6.6.3  人工神經網路的適用場合
  6.7  有監督學習模型與無監督學習模型
  6.8  K-means模型
    6.8.1  兩個基本概念
    6.8.2  K-means迭代演算法
  6.9  偏差-方差權衡
    6.9.1  偏差-方差困境
    6.9.2  過擬合與欠擬合
    6.9.3  K-折交叉驗證
  6.10  參數的網格搜索
  6.11  集成學習
    6.11.1  孔多塞陪審團定理
    6.11.2  決策樹集成
  思考題
第7章  結果展示
  7.1  區分面向對象的結果展示
    7.1.1  面向出資方的結果展示
    7.1.2  面向用戶的結果展示
    7.1.3  面向數據科學家的結果展示
  7.2  展示過程中的可視化
    7.2.1  展示可視化的兩個層面
    7.2.2  展示可視化的三點基本原則
結語
參考文獻

  • 商品搜索:
  • | 高級搜索
首頁新手上路客服中心關於我們聯絡我們Top↑
Copyrightc 1999~2008 美商天龍國際圖書股份有限公司 臺灣分公司. All rights reserved.
營業地址:臺北市中正區重慶南路一段103號1F 105號1F-2F
讀者服務部電話:02-2381-2033 02-2381-1863 時間:週一-週五 10:00-17:00
 服務信箱:bookuu@69book.com 客戶、意見信箱:cs@69book.com
ICP證:浙B2-20060032