幫助中心 | 我的帳號 | 關於我們

描述統計與探索性數據分析/數據科學方法及應用系列

  • 作者:編者:張理|責編:姚莉麗//賈曉瑞
  • 出版社:科學
  • ISBN:9787030778468
  • 出版日期:2025/04/01
  • 裝幀:平裝
  • 頁數:284
人民幣:RMB 75 元      售價:
放入購物車
加入收藏夾

內容大鋼
    本書是數據科學方法及應用系列教材之一。本書融合統計學和數據科學的方法,系統介紹描述統計和探索性數據分析的原理和方法。主要內容包括:指標設計、數據預處理、描述統計量計算、數據可視化、相關分析、關聯分析、聚類分析、綜合指數分析等。重點介紹數據分析的統計流程和軟體實現方法,培養學生理解數據、分析數據的基本能力。
    本書將基本理論與應用相結合,實用性、操作性較強,可廣泛應用在需要開展數據分析的各個領域。本書採用四模塊結構:理論與方法+案例分析+R軟體應用(含代碼)+思考與練習,並提供第3?8章的在線自測習題,習題內容覆蓋主要學習要點,題型包括選擇題、填空題、計算題、軟體應用題等,幫助學習者檢驗學習效果。通過掃描二維碼獲取相關在線資源和習題。
    本書不僅可作為統計學專業低年級本科生的基礎課教材,還可作為經濟學、社會學、生物醫學等學科開設統計學、數據分析課程的教材或教學參考書。

作者介紹
編者:張理|責編:姚莉麗//賈曉瑞

目錄
叢書序
前言
第1章  總論
  1.1  數據的定義
  1.2  數據的特點
  1.3  數據的類型
  1.4  本書框架介紹
  1.5  R軟體應用
    初步認識R軟體
  思考與練習
第2章  統計指標概述
  2.1  統計指標的含義
    2.1.1  指標與統計指標
    2.1.2  統計指標的特點
    2.1.3  統計指標的構成要素
  2.2  統計指標類型
    2.2.1  根據指標形式和作用分類
    2.2.2  根據指標值獲取方式分類
    2.2.3  根據指標反映的數量關係分類
    2.2.4  根據指標數值類型分類
  2.3  統計指標設計
    2.3.1  統計指標設計原則
    2.3.2  統計指標設計步驟
  2.4  案例分析
    可持續發展投入產出效率測度指標設計
  2.5  R軟體應用
    創建數據對象及讀入外部數據
  思考與練習
第3章  數據採集
  3.1  數據採集渠道
    3.1.1  調查
    3.1.2  觀測
    3.1.3  實驗
    3.1.4  網路數據採集
    3.1.5  手機APP數據
  3.2  數據採集方法及技術
    3.2.1  抽樣調查方法
    3.2.2  網路數據採集方法
    3.2.3  APP數據採集方法
  3.3  案例分析
    抽樣方法的具體應用
  3.4  R軟體應用
    抽樣方法和八爪魚軟體應用
  思考與練習
第4章  數據預處理
  4.1  數據審核
    4.1.1  直接來源數據審核
    4.1.2  間接來源數據審核
  4.2  數據清洗
    4.2.1  數據篩選

    4.2.2  缺失數據處理
    4.2.3  異常數據處理
    4.2.4  數據脫敏
  4.3  數據變換
    4.3.1  數據編碼
    4.3.2  數據標準化
  4.4  數據集成
  4.5  數據歸約
  4.6  案例分析
    缺失數據插補
  4.7  R軟體應用
    數據採集與預處理
  思考與練習
第5章  數據基本特徵測度
  5.1  數據基本特徵概述
  5.2  頻數統計
    5.2.1  頻數統計概述
    5.2.2  頻數統計表及編製
    5.2.3  頻數統計表的類型
  5.3  集中趨勢測度
    5.3.1  幾種常見平均數
    5.3.2  中位數
    5.3.3  眾數
  5.4  離散程度測度
  5.5  數據分佈形態測度
    5.5.1  矩
    5.5.2  偏度與偏度係數
    5.5.3  峰度
  5.6  動態趨勢測度
    5.6.1  發展速度
    5.6.2  增長速度
  5.7  案例分析
    R自帶數據集iris(鳶尾花)的描述統計指標計算
  5.8  R軟體應用
    計算描述統計量
  思考與練習
第6章  數據可視化
  6.1  統計圖形的基本要素
  6.2  數據規模和結構可視化圖
    6.2.1  條形圖
    6.2.2  餅圖
    6.2.3  玫瑰圖
    6.2.4  矩形樹圖
    6.2.5  馬賽克圖
  6.3  數據分佈可視化圖
    6.3.1  直方圖
    6.3.2  箱線圖
    6.3.3  概率密度圖
  6.4  數據變化趨勢圖
    6.4.1  點圖

    6.4.2  線圖
  6.5  多維數據可視化
    6.5.1  雷達圖
    6.5.2  星圖
    6.5.3  臉譜圖
  6.6  文本數據可視化
    6.6.1  詞雲圖
    6.6.2  社會網路圖
  6.7  案例分析
    R數據集HairEyeColor(頭髮眼睛顏色)可視化
    R數據集iris(鳶尾花)植物特徵可視化
    R數據集ToothGrowth(豚鼠牙齒生長)特徵可視化
  6.8  R軟體應用
    數據可視化
  思考與練習
第7章  相關與關聯分析
  7.1  相關關係
    7.1.1  一般相關關係
    7.1.2  典型相關分析
  7.2  相關關係可視化
    7.2.1  二維散點圖
    7.2.2  三維散點圖
    7.2.3  氣泡圖
    7.2.4  散點圖矩陣
    7.2.5  相關係數矩陣
  7.3  關聯分析
    7.3.1  關聯規則的基本概念
    7.3.2  關聯規則的Apriori演算法
  7.4  案例分析
    鳶尾花的外形特徵相關關係
    科技創新活動投入和產出的典型相關分析
    Apriori演算法示例
  7.5  R軟體應用
    相關與關聯分析
  思考與練習
第8章  聚類分析
  8.1  聚類分析概述
  8.2  距離的計算方法
    8.2.1  歐氏距離
    8.2.2  曼哈頓距離
    8.2.3  明氏距離
    8.2.4  蘭氏距離
    8.2.5  馬氏距離
    8.2.6  相關距離
    8.2.7  餘弦相似度
    8.2.8  漢明距離
  8.3  聚類演算法
    8.3.1  系統聚類方法
    8.3.2  K-means聚類法
    8.3.3  K-modes聚類法

  8.4  最佳K值的兩種確定方法
    8.4.1  肘部法
    8.4.2  輪廓係數法
  8.5  案例分析
    紅酒質量數據的聚類分析
  8.6  R軟體應用
    聚類函數的應用
  思考與練習
第9章  綜合指數分析
  9.1  綜合指數分析概述
  9.2  以專家賦權為主的綜合指數分析
    9.2.1  專家評分法
    9.2.2  德爾菲法
    9.2.3  層次分析法
  9.3  以數據特徵賦權為主的綜合指數分析
    9.3.1  熵權法
    9.3.2  變異係數法
    9.3.3  主成分分析法
    9.3.4  TOPSIS方法
    9.3.5  灰色關聯分析法
  9.4  案例分析
    高技術產業創新能力綜合評價
  9.5  R軟體應用
    綜合指數計算
  思考與練習
參考文獻
附錄

  • 商品搜索:
  • | 高級搜索
首頁新手上路客服中心關於我們聯絡我們Top↑
Copyrightc 1999~2008 美商天龍國際圖書股份有限公司 臺灣分公司. All rights reserved.
營業地址:臺北市中正區重慶南路一段103號1F 105號1F-2F
讀者服務部電話:02-2381-2033 02-2381-1863 時間:週一-週五 10:00-17:00
 服務信箱:bookuu@69book.com 客戶、意見信箱:cs@69book.com
ICP證:浙B2-20060032