幫助中心 | 我的帳號 | 關於我們

R語言數據分析(基礎演算法與實戰全彩印刷)

  • 作者:編者:孫玉林|責編:耍利娜//張賽
  • 出版社:化學工業
  • ISBN:9787122436009
  • 出版日期:2023/09/01
  • 裝幀:平裝
  • 頁數:276
人民幣:RMB 99 元      售價:
放入購物車
加入收藏夾

內容大鋼
    本書基於主流統計分析編程語言R,介紹了常用的數據分析方法及其實戰應用,內容涵蓋了R語言的使用、基於ggplot2包及其拓展包的數據可視化、數據的清洗與探索、數據分析、數據挖掘以及統計分析方法等。本書在講解數據分析時,主要基於tidyverse系列包進行數據整理、操作與可視化,基於tidymodels系列包進行數據分析、統計分析、機器學習等演算法的應用,其它的R包用於數據分析的輔助。使用R語言時,遵循更新更簡潔的編程方式。
    本書內容循序漸進,講解通俗易懂,同時配套源程序和數據文件,讀者可以邊學邊實踐。
    本書可供從事數據分析、數據可視化、機器學習的科研及技術人員閱讀使用,也可作為高等院校中統計學、電腦科學等相關專業的教材。

作者介紹
編者:孫玉林|責編:耍利娜//張賽

目錄
第1章  R語言與數據分析
  1.1  R與RStudio安裝
    1.1.1  R語言安裝
    1.1.2  RStudio安裝
    1.1.3  R包安裝
  1.2  數據分析簡介
    1.2.1  數據分析的內容
    1.2.2  數據分析工作流程
    1.2.3  什麼是數據分析師
    1.2.4  數據分析師需要的技術和知識
  1.3  R語言與數據分析
    1.3.1  R語言為何適合數據分析
    1.3.2  R語言常用數據分析包
  1.4  本章小結
第2章  R語言快速入門
  2.1  向量的數據類型
    2.1.1  數值型
    2.1.2  邏輯值型
    2.1.3  字元型
    2.1.4  因子型
  2.2  矩陣與高維數組
    2.2.1  矩陣
    2.2.2  高維數組
  2.3  數據框與列表
    2.3.1  數據框
    2.3.2  列表
  2.4  條件判斷與循環語句
    2.4.1  條件判斷語句
    2.4.2  循環語句
  2.5  編寫自己的函數
  2.6  本章小結
第3章  R語言數據管理與操作
  3.1  數據導入與保存
    3.1.1  數據導入
    3.1.2  數據保存
  3.2  處理缺失值
    3.2.1  缺失值發現
    3.2.2  缺失值填充
  3.3  數據操作
    3.3.1  數據並行計算
    3.3.2  數據選擇、過濾、分組
    3.3.3  數據融合
    3.3.4  進行長寬數據轉換
  3.4  其它數據處理
    3.4.1  lubridate包處理時間數據
    3.4.2  stringr包處理文本數據
  3.5  本章小結
第4章  R語言數據可視化
  4.1  R語言基礎繪圖系統
    4.1.1  基礎繪圖系統可視化基本設置

    4.1.2  基礎繪圖系統可視化實戰
  4.2  ggplot2包數據可視化
    4.2.1  使用圖層構建圖像
    4.2.2  ggplot2可視化進階
  4.3  R語言其它數據可視化包
    4.3.1  GGally包數據可視化
    4.3.2  ggChernoff包數據可視化
    4.3.3  ggTimeSeries包數據可視化
    4.3.4  pheatmap包數據可視化
    4.3.5  igraph包數據可視化
    4.3.6  wordcloud包數據可視化
    4.3.7  ComplexUpset包數據可視化
  4.4  本章小結
第5章  R語言數據分析
  5.1  相關性分析
    5.1.1  相關係數介紹
    5.1.2  相關係數計算與可視化分析
  5.2  方差分析
    5.2.1  單因素方差分析
    5.2.2  雙因素方差分析
  5.3  降維
    5.3.1  常用數據降維演算法
    5.3.2  數據降維實戰
  5.4  回歸分析
    5.4.1  常用回歸演算法
    5.4.2  回歸評價指標
    5.4.3  數據回歸實戰
  5.5  分類
    5.5.1  常用分類演算法
    5.5.2  分類評價指標
    5.5.3  數據分類實戰
  5.6  聚類
    5.6.1  常用數據聚類演算法
    5.6.2  聚類評價指標
    5.6.3  數據聚類實戰
  5.7  時間序列預測
    5.7.1  時序預測的相關模型
    5.7.2  時間序列預測實戰
  5.8  本章小結
第6章  綜合案例1:中藥材鑒別
  6.1  聚類演算法鑒別藥材種類
    6.1.1  數據探索與可視化
    6.1.2  數據降維與特徵提取
    6.1.3  數據聚類
  6.2  分類演算法鑒別藥材的產地
    6.2.1  數據導入與探索
    6.2.2  選擇數據中的重要特徵
    6.2.3  鑒別藥材的產地
  6.3  分類演算法鑒別藥材的類別
    6.3.1  數據導入與探索

    6.3.2  數據特徵降維
    6.3.3  預測藥材的類別
  6.4  分類演算法預測藥材的產地
    6.4.1  數據導入與探索
    6.4.2  數據特徵降維
    6.4.3  預測藥材的產地
  6.5  本章小結
第7章  綜合案例2:抗乳腺癌候選藥物分析
  7.1  數據特徵提取
    7.1.1  數據可視化探索
    7.1.2  特徵選擇
  7.2  回歸模型預測生物活性
    7.2.1  利用隨機森林提取的特徵建立回歸模型
    7.2.2  利用Lasso回歸提取的特徵建立回歸模型
  7.3  分類模型預測二分類變數
    7.3.1  通過遞歸特徵消除提取特徵建立分類模型
    7.3.2  通過主成分降維提取特徵建立分類模型
  7.4  本章小結
第8章  綜合案例3:文本內容數據分析
  8.1  文本預處理
    8.1.1  讀取文本數據
    8.1.2  文本數據清洗
  8.2  特徵提取與可視化
    8.2.1  TF特徵
    8.2.2  TF-IDF特徵
    8.2.3  詞雲可視化
  8.3  文本聚類
    8.3.1  LDA主題模型聚類
    8.3.2  K均值聚類
  8.4  對文本進行分類
    8.4.1  基於TF-IDF特徵建立分類模型
    8.4.2  基於TF特徵建立分類模型
  8.5  中文文本數據分析
    8.5.1  《三國演義》文本數據預處理
    8.5.2  對文本數據探索與特徵提取
    8.5.3  建立LDA主題模型
  8.6  本章小結
參考文獻

  • 商品搜索:
  • | 高級搜索
首頁新手上路客服中心關於我們聯絡我們Top↑
Copyrightc 1999~2008 美商天龍國際圖書股份有限公司 臺灣分公司. All rights reserved.
營業地址:臺北市中正區重慶南路一段103號1F 105號1F-2F
讀者服務部電話:02-2381-2033 02-2381-1863 時間:週一-週五 10:00-17:00
 服務信箱:bookuu@69book.com 客戶、意見信箱:cs@69book.com
ICP證:浙B2-20060032