幫助中心 | 我的帳號 | 關於我們

R語言統計分析與可視化從入門到精通

  • 作者:張良康|責編:王繼偉//姜寶雪
  • 出版社:北京大學
  • ISBN:9787301354469
  • 出版日期:2024/10/01
  • 裝幀:平裝
  • 頁數:452
人民幣:RMB 119 元      售價:
放入購物車
加入收藏夾

內容大鋼
    本書循序漸進、深入講解了R語言數據統計分析與應用的核心知識,並通過具體實例的實現過程演練了知識點的用法和流程。全書共16章,分別講解了R語言基礎、R語言數據統計語法基礎、數據獲取和處理、繪製可視化統計圖、描述性統計分析、探索性數據分析、推論統計、回歸分析、方差分析、非參數統計分析、主成分分析、聚類分析、生存分析、因子分析、基於機器學習的患者再入院預測分析系統和中概科技指數統計分析與投資系統。全書簡潔而不失其技術深度,內容豐富全面,歷史資料翔實齊全。同時,本書易於閱讀,以極簡的文字介紹了複雜的案例,同時涵蓋了其他同類圖書中很少涉及的歷史參考資料,是學習R語言數據統計分析與應用的實用教程。
    本書適用於已經了解R語言基礎知識的讀者,以及想進一步學習數據分析、統計分析、行業統計應用的讀者,也可以作為相關從業者的參考書,還可以作為大專院校相關專業的師生用書和培訓學校的專業性教材。

作者介紹
張良康|責編:王繼偉//姜寶雪
    張良康,浙江大學統計學博士,現就職于恆瑞醫藥,負責醫藥臨床試驗數據分析和統計工作,參與臨床試驗方案設計溝通和討論,為臨床試驗方案中統計學相關內容提供技術支持,包括研究設計方法的選擇、樣本量計算、隨機和盲法、統計方法的選擇等。使用R語言、SAS、SPSS等統計分析技術高達8年以上,擅長數據挖掘、分析和統計工作。具有多年的數據統計分析經驗,對商務數據、銷售數據、科研數據、醫學數據和金融數據的統計分析工作也頗有研究。

目錄
第1章  R語言基礎
  1.1  R語言的發展歷程
  1.2  R 語言的特點
  1.3  獲取並安裝R語言運行環境
    1.3.1  在Windows操作系統安裝R語言
    1.3.2  在Linux操作系統和macOS操作系統安裝R語言
  1.4  R語言開發工具:R GUI
    1.4.1  命令行方式運行R語言程序
    1.4.2  文件方式運行R語言程序
  1.5  R語言開發工具:RStudio
    1.5.1  安裝RStudio
    1.5.2  RStudio界面簡介
    1.5.3  使用RStudio開發R語言程序
  1.6  認識第一個R語言程序:簡易數據統計與格式化輸出
    1.6.1  新建R語言工程
    1.6.2  編寫程序文件
  1.7  R語言和數據處理
    1.7.1  R語言的優勢
    1.7.2  數據處理和數據分析的區別
第2章  R語言數據統計語法基礎
  2.1  基本的內置函數
    2.1.1  數學和統計函數
    2.1.2  字元和字元串處理函數
    2.1.3  文件操作函數
    2.1.4  概率分佈函數
    2.1.5  日期函數和時間函數
  2.2  內置數據處理函數
    2.2.1  查看、篩選和編輯數據
    2.2.2  合併數據
    2.2.3  分組和匯總
    2.2.4  排序
    2.2.5  轉換
  2.3  apply函數族
    2.3.1  apply函數族中的函數
    2.3.2  函數apply()
    2.3.3  函數lapply()
    2.3.4  函數sapply()
    2.3.5  函數vapply()
    2.3.6  函數mapply()
  2.4  數據重塑與變形
  2.5  數據查詢與過濾
    2.5.1  使用dplyr包進行數據查詢和過濾
    2.5.2  使用sqldf包進行SQL風格的查詢
第3章  數據獲取和處理
  3.1  數據獲取和處理簡介
  3.2  使用鍵盤輸入數據
  3.3  處理CSV數據
    3.3.1  讀取CSV文件
    3.3.2  寫入CSV文件
    3.3.3  數據轉換和處理

  3.4  處理Excel數據
    3.4.1  R語言和Excel文件
    3.4.2  使用readxl包
    3.4.3  使用openxlsx包
  3.5  處理XML數據
    3.5.1  使用XML包
    3.5.2  使用xml2包
  3.6  處理JSON數據
    3.6.1  JSON包
    3.6.2  使用jsonlite包
    3.6.3  使用RJSONIO包
    3.6.4  使用tidyjson包
  3.7  處理MySQL數據
    3.7.1  和MySQL相關的包
    3.7.2  使用RMySQL包
    3.7.3  使用RMariaDB包
    3.7.4  使用DBI包
    3.7.5  dplyr包和dbplyr包
  3.8  從網頁抓取數據
    3.8.1  使用rvest包抓取數據
    3.8.2  使用httr包抓取數據
    3.8.3  使用XML包抓取數據
    3.8.4  使用jsonlite包抓取數據
  3.9  數據準備與清洗
    3.9.1  缺失數據處理
    3.9.2  異常值檢測和處理
    3.9.3  異常值檢測方法小結
第4章  繪製可視化統計圖
  4.1  R語言繪圖系統簡介
    4.1.1  常用的繪圖包
    4.1.2  基本繪圖函數plot()
  4.2  單變數繪圖
    4.2.1  繪製直方圖
    4.2.2  繪製條形圖
    4.2.3  繪製餅形圖
    4.2.4  繪製箱線圖
    4.2.5  繪製密度圖
  4.3  雙變數繪圖
    4.3.1  繪製雙變數條形圖
    4.3.2  繪製散點圖
    4.3.3  繪製折線圖
    4.3.4  繪製箱線圖(雙變數)
  4.4  繪製多變數圖
    4.4.1  繪製氣泡圖
    4.4.2  繪製熱力圖
  4.5  文件數據的可視化
    4.5.1  CSV文件數據的可視化
    4.5.2  Excel文件數據的可視化
    4.5.3  XML文件數據的可視化
    4.5.4  JSON文件數據的可視化

    4.5.5  MySQL資料庫數據的可視化
第5章  描述性統計分析
  5.1  描述性統計分析簡介
  5.2  平均數、中位數和眾數
    5.2.1  計算平均數
    5.2.2  計算中位數
    5.2.3  計算眾數
  5.3  方差和標準差
    5.3.1  計算方差
    5.3.2  計算標準差
  5.4  百分位數
    5.4.1  常見的百分位數
    5.4.2  計算百分位數
第6章  探索性數據分析
  6.1  EDA簡介
  6.2  檢測重複值
    6.2.1  檢測重複值簡介
    6.2.2  R語言檢測重複值的方法
  6.3  數據可視化方法
  6.4  相關性分析
    6.4.1  相關性分析的基本信息
    6.4.2  皮爾遜相關係數
    6.4.3  斯皮爾曼相關係數
    6.4.4  肯德爾相關係數
第7章  推論統計
  7.1  抽樣和抽樣分佈
  7.2  置信區間
    7.2.1  置信區間的概念
    7.2.2  總體均值的置信區間
    7.2.3  總體比例的置信區間
    7.2.4  總體方差的置信區間
  7.3  假設檢驗
    7.3.1  假設檢驗的基本步驟
    7.3.2  假設檢驗中的錯誤類型
  7.4  抽樣方法
    7.4.1  隨機抽樣
    7.4.2  系統抽樣
    7.4.3  分層抽樣
    7.4.4  多階段抽樣
  7.5  推論統計的方向小結
    7.5.1  參數推斷
    7.5.2  非參數推斷
第8章  回歸分析
  8.1  回歸分析簡介
  8.2  線性回歸和多元線性回歸
    8.2.1  線性回歸
    8.2.2  多元線性回歸
  8.3  邏輯回歸
    8.3.1  邏輯回歸簡介
    8.3.2  邏輯回歸的應用領域

    8.3.3  使用邏輯回歸模型
  8.4  非線性回歸
    8.4.1  非線性回歸簡介
    8.4.2  使用非線性回歸模型
  8.5  條件回歸
    8.5.1  條件回歸簡介
    8.5.2  使用條件回歸模型
第9章  方差分析
  9.1  方差分析簡介
  9.2  單因素方差分析
    9.2.1  單因素方差分析的步驟
    9.2.2  單因素方差分析的應用
  9.3  多因素方差分析
    9.3.1  多因素方差分析簡介
    9.3.2  兩因素方差分析
    9.3.3  多因素方差分析
  9.4  協方差分析
    9.4.1  協方差分析方法簡介
    9.4.2  協方差分析的應用
第10章  非參數統計分析
  10.1  非參數統計的方法
  10.2  秩和檢驗
    10.2.1  秩和檢驗簡介
    10.2.2  使用秩和檢驗
  10.3  Wilcoxon符號秩檢驗
    10.3.1  Wilcoxon符號秩檢驗簡介
    10.3.2  使用Wilcoxon符號秩檢驗
  10.4  Kruskal-Wallis檢驗
    10.4.1  Kruskal-Wallis檢驗簡介
    10.4.2  使用Kruskal-Wallis檢驗
  10.5  Friedman檢驗
    10.5.1  Friedman檢驗簡介
    10.5.2  使用Friedman檢驗
  10.6  卡方檢驗
    10.6.1  卡方檢驗簡介
    10.6.2  卡方擬合度檢驗
    10.6.3  卡方獨立性檢驗
  10.7  符號檢驗
    10.7.1  符號檢驗簡介
    10.7.2  使用符號檢驗
第11章  主成分分析
  11.1  PCA簡介
    11.1.1  PCA的概念
    11.1.2  PCA的應用領域
  11.2  PCA的數學原理
    11.2.1  主成分的提取
    11.2.2  PCA的可解釋性
  11.3  PCA的應用:信用卡欺詐檢測
    11.3.1  準備R語言包
    11.3.2  導入數據集

    11.3.3  計算ROC和AUC
    11.3.4  可視化處理
    11.3.5  顯示混淆矩陣
    11.3.6  探索數據
    11.3.7  相關性分析
    11.3.8  使用隨機森林模型
    11.3.9  欺詐預測
    11.3.10  結論
第12章  聚類分析
  12.1  聚類分析簡介
    12.1.1  聚類分析的基本概念
    12.1.2  聚類分析的方法
    12.1.3  聚類分析的應用領域
  12.2  K均值聚類
    12.2.1  K均值聚類簡介
    12.2.2  K均值聚類的應用
  12.3  層次聚類
    12.3.1  層次聚類簡介
    12.3.2  層次聚類的應用
  12.4  DBSCAN聚類
    12.4.1  DBSCAN簡介
    12.4.2  DBSCAN的應用領域
    12.4.3  使用DBSCAN聚類演算法
  12.5  高斯混合模型聚類
    12.5.1  高斯混合模型聚類簡介
    12.5.2  高斯混合模型聚類的應用
  12.6  譜聚類
    12.6.1  譜聚類簡介
    12.6.2  譜聚類的應用
第13章  生存分析
  13.1  生存分析簡介
    13.1.1  生存分析的基本概念
    13.1.2  生存分析的應用領域
    13.1.3  用R語言實現生存分析
  13.2  Kaplan-Meier生存曲線
    13.2.1  Kaplan-Meier生存曲線的解釋
    13.2.2  Kaplan-Meier生存曲線的構建
  13.3  Cox比例風險模型
    13.3.1  Cox比例風險模型簡介
    13.3.2  Cox比例風險模型的應用
  13.4  心血管疾病的生存分析實戰
    13.4.1  數據集簡介
    13.4.2  數據預處理
    13.4.3  二元變數分佈
    13.4.4  連續變數分佈
    13.4.5  死亡事件計數與生存時間
    13.4.6  相關性分析
    13.4.7  變數選擇的機器學習模型
    13.4.8  生存分析
    13.4.9  總結

第14章  因子分析
  14.1  因子分析簡介
    14.1.1  因子分析的基本概念
    14.1.2  因子分析的應用領域
  14.2  因子分析方法
    14.2.1  常用的因子分析方法
    14.2.2  最大似然估計法
    14.2.3  最小二乘法
    14.2.4  廣義最小二乘法
    14.2.5  主軸因子分析
    14.2.6  因子旋轉
    14.2.7  因子得分估計
  14.3  因子分析的應用:心血管疾病風險因素分析系統
    14.3.1  設置環境
    14.3.2  數據準備和探索
    14.3.3  相關性分析
    14.3.4  總結
第15章  基於機器學習的患者再入院預測分析系統
  15.1  背景簡介
  15.2  需求分析
  15.3  系統分析
  15.4  系統簡介
    15.4.1  系統功能簡介
    15.4.2  系統模塊結構
  15.5  技術分析
    15.5.1  dplyr:數據預處理
    15.5.2  psych:心理學和社會科學研究
    15.5.3  ROSE:不平衡處理
    15.5.4  caret模型訓練和評估
  15.6  數據處理
    15.6.1  導入數據集
    15.6.2  數據預處理
  15.7  第一方案
    15.7.1  劃分訓練集和測試集
    15.7.2  數據集平衡
    15.7.3  交叉驗證
    15.7.4  模型比較
  15.8  第二方案
    15.8.1  數據集拆分和數據平衡
    15.8.2  邏輯回歸模型擬合和預測
    15.8.3  計算處理
    15.8.4  邏輯回歸模型的擬合、預測和評估
    15.8.5  使用交叉驗證方法訓練決策樹模型
    15.8.6  使用交叉驗證方法訓練隨機森林模型
    15.8.7  實現樸素貝葉斯模型
  15.9  模型訓練和評估
    15.9.1  數據預處理
    15.9.2  邏輯回歸模型的訓練和評估
    15.9.3  決策樹模型的訓練和評估
    15.9.4  隨機森林模型的訓練和評估

    15.9.5  樸素貝葉斯模型的訓練和評估
  15.10  結論
第16章  中概科技指數統計分析與投資系統
  16.1  背景簡介
  16.2  需求分析
  16.3  系統分析
    16.3.1  系統目標
    16.3.2  系統模塊
    16.3.3  數據處理流程
  16.4  技術棧
    16.4.1  Tidyquant:財務數據分析
    16.4.2  Tidyverse:數據處理工具
    16.4.3  Loess平滑演算法:非參數統計方法
  16.5  數據處理
  16.6  中概股技術分析
    16.6.1  股票價格和收益分析
    16.6.2  配對分析統計圖
    16.6.3  MACD技術分析統計圖
    16.6.4  OBV技術分析統計圖
    16.6.5  CCI技術分析統計圖
    16.6.6  Chaikin AD Line技術分析統計圖
    16.6.7  相對錶現比率統計圖
    16.6.8  RSI技術分析統計圖
    16.6.9  交易差價技術分析統計圖
    16.6.10  CCI密度圖
    16.6.11  自定義指數技術分析統計圖

  • 商品搜索:
  • | 高級搜索
首頁新手上路客服中心關於我們聯絡我們Top↑
Copyrightc 1999~2008 美商天龍國際圖書股份有限公司 臺灣分公司. All rights reserved.
營業地址:臺北市中正區重慶南路一段103號1F 105號1F-2F
讀者服務部電話:02-2381-2033 02-2381-1863 時間:週一-週五 10:00-17:00
 服務信箱:bookuu@69book.com 客戶、意見信箱:cs@69book.com
ICP證:浙B2-20060032