幫助中心 | 我的帳號 | 關於我們

R語言數據分析與挖掘(微課版數據科學與統計系列規劃教材)

  • 作者:編者:謝佳標|責編:許金霞
  • 出版社:人民郵電
  • ISBN:9787115586339
  • 出版日期:2022/09/01
  • 裝幀:平裝
  • 頁數:268
人民幣:RMB 62 元      售價:
放入購物車
加入收藏夾

內容大鋼
    本書由淺入深,內容豐富,全面系統地介紹了R語言基礎知識和使用R語言進行數據分析與挖掘的方法。全書共12章,主要內容包括R語言數據分析概述、R語言數據操作基礎、R語言數據讀寫、數據基本管理、數據預處理、R語言的重要繪圖函數、高級繪圖工具、聚類分析、回歸分析、決策樹、神經網路與支持向量機和模型性能評估及優化。本書可作為高等院校數據科學與大數據技術、大數據管理與應用專業相關課程的教材,也可作為初級數據分析學習者學習數據分析的參考書。

作者介紹
編者:謝佳標|責編:許金霞

目錄
第1章  R語言數據分析概述
  1.1  認識數據分析
    1.1.1  為什麼要對數據做分析
    1.1.2  數據分析的流程
  1.2  R語言的簡介及安裝
    1.2.1  R語言簡介
    1.2.2  R語言的安裝
    1.2.3  其他輔助工具
    1.2.4  R語言快速上手
  1.3  小結
  1.4  本章練習
第2章  R語言數據操作基礎
  2.1  R語言數據類型
    2.1.1  數據類型判斷及轉換
    2.1.2  日期類型數據處理
  2.2  R語言數據對象
    2.2.1  向量
    2.2.2  矩陣和數組
    2.2.3  因子
    2.2.4  列表和數據框
  2.3  文本處理
    2.3.1  基礎文本處理
    2.3.2  stringr擴展包
  2.4  小結
  2.5  本章練習
第3章  R語言數據讀寫
  3.1  文本文件讀寫
    3.1.1  base包
    3.1.2  readr包
    3.1.3  data.table包
  3.2  Excel文件讀寫
    3.2.1  xlsx包
    3.2.2  XLConnect包
    3.2.3  openxlsx包
    3.2.4  readxl包
  3.3  資料庫文件讀寫
    3.3.1  RODBC包
    3.3.2  RMySQL包
  3.4  本章小結
  3.5  本章練習
第4章  數據基本管理
  4.1  數據去重
  4.2  數據排序
  4.3  數據篩選
  4.4  數據合併
  4.5  數據關聯
  4.6  數據轉換
  4.7  融合重鑄
  4.8  數據聚合
  4.9  數據分組

  4.10  本章小結
  4.11  本章練習
第5章  數據預處理
  5.1  數據抽樣
    5.1.1  數據抽樣的必要性
    5.1.2  類失衡處理方法:SMOTE()函數
    5.1.3  數據隨機抽樣:sample()函數
    5.1.4  數據等比抽樣:createDataPartition()函數
    5.1.5  用於交叉驗證的樣本抽樣
  5.2  數據清洗
    5.2.1  缺失值判斷及處理
    5.2.2  異常值判斷處理
  5.3  數據變換
    5.3.1  數據分箱
    5.3.2  數據標準化
  5.4  數據啞變數處理
  5.5  本章小結
  5.6  本章練習
第6章  R語言重要繪圖技術
  6.1  圖形三要素
    6.1.1  顏色元素
    6.1.2  文字元素
    6.1.3  點線元素
  6.2  低級繪圖函數
    6.2.1  標題
    6.2.2  坐標軸
    6.2.3  圖例
    6.2.4  網格線
    6.2.5  點
    6.2.6  文字
    6.2.7  線
  6.3  高級繪圖函數
    6.3.1  散點圖
    6.3.2  氣泡圖
    6.3.3  線圖
    6.3.4  柱狀圖
    6.3.5  餅圖
    6.3.6  直方圖和密度圖
    6.3.7  箱線圖
  6.4  本章小結
  6.5  本章練習
第7章  高級繪圖工具
  7.1  ggplot2繪圖工具
    7.1.1  從qplot()開始
    7.1.2  ggplot()作圖
    7.1.3  ggplot2擴展包
  7.2  互動式繪圖工具
    7.2.1  recharts包
    7.2.2  recharts包
    7.2.3  rbokeh包

    7.2.4  plotly包
  7.3  本章小結
  7.4  本章練習
第8章  聚類分析
  8.1  概述
  8.2  聚類距離度量
  8.3  層次聚類
    8.3.1  層次聚類原理
    8.3.2  R語言實現
    8.3.3  聚類樹形圖可視化
    8.3.4  比較聚類樹形圖
  8.4  K-均值聚類
    8.4.1  K-均值聚類原理
    8.4.2  R語言實現
  8.5  K-中心點聚類
  8.6  密度聚類
    8.6.1  密度聚類原理
    8.6.2  R語言實現
  8.7  集群評估及驗證
    8.7.1  估計聚類趨勢
    8.7.2  確定數據集中的簇數
    8.7.3  集群驗證
  8.8  本章小結
  8.9  本章練習
第9章  回歸分析
  9.1  簡單線性回歸
    9.1.1  簡單線性回歸原理
    9.1.2  簡單線性回歸R語言實現
    9.1.3  模型診斷及預測
    9.1.4  指數變換
    9.1.5  多項式回歸
  9.2  多元線性回歸
  9.3  自變數有定性變數的回歸
  9.4  逐步回歸
  9.5  多重共線性分析
  9.6  線性回歸的正則化
    9.6.1  為什麼要使用正則化
    9.6.2  嶺回歸的原理
    9.6.3  LASSO回歸的原理
    9.6.4  glmnet包簡介
    9.6.5  綜合案例
  9.7  邏輯回歸
    9.7.1  邏輯回歸基本原理
    9.7.2  邏輯回歸的R語言實現
  9.8  本章小結
  9.9  本章練習
第10章  決策樹
  10.1  決策樹概述
  10.2  決策樹基本原理
    10.2.1  ID3演算法

    10.2.2  C4.5演算法
    10.2.3  CART演算法
  10.3  R語言實現及案例
    10.3.1  R語言實現
    10.3.2  C5.0案例
    10.3.3  CART案例
    10.3.4  條件推理決策樹案例
    10.3.5  繪製決策邊界
  10.4  本章小結
  10.5  本章練習
第11章  神經網路與支持向量機
  11.1  理解神經網路
    11.1.1  激活函數
    11.1.2  網路結構
    11.1.3  人工神經網路的主要類型
  11.2  神經網路的R語言實現
  11.3  基於神經網路進行類別預測
  11.4  理解支持向量機
  11.5  支持向量機的R語言實現
  11.6  基於支持向量機進行類別預測
  11.7  本章小結
  11.8  本章練習
第12章  模型性能評估及優化
  12.1  模型性能評估
    12.1.1  數值預測評估方法
    12.1.2  概率預測評估方法
  12.2  模型參數優化
    12.2.1  訓練集、驗證集、測試集的引入
    12.2.2  K折交叉驗證
    12.2.3  網格搜索
  12.3  本章小結
  12.4  本章練習

  • 商品搜索:
  • | 高級搜索
首頁新手上路客服中心關於我們聯絡我們Top↑
Copyrightc 1999~2008 美商天龍國際圖書股份有限公司 臺灣分公司. All rights reserved.
營業地址:臺北市中正區重慶南路一段103號1F 105號1F-2F
讀者服務部電話:02-2381-2033 02-2381-1863 時間:週一-週五 10:00-17:00
 服務信箱:bookuu@69book.com 客戶、意見信箱:cs@69book.com
ICP證:浙B2-20060032