幫助中心 | 我的帳號 | 關於我們

R數據挖掘實戰

  • 作者:(意)安德烈亞·奇里洛|責編:余潔|譯者:王燕//王存?
  • 出版社:人民郵電
  • ISBN:9787115616456
  • 出版日期:2024/05/01
  • 裝幀:平裝
  • 頁數:310
人民幣:RMB 99.8 元      售價:
放入購物車
加入收藏夾

內容大鋼
    R語言數據挖掘被廣泛應用於不同領域,包括金融、醫學、科學研究等。本書通過具體實例和真實的數據集來實現數據挖掘,首先講解了數據挖掘的基本概念和R語言的基礎知識,隨後介紹了R語言中與數據挖掘相關的各種擴展功能包的使用,並通過多個實際的例子,教會讀者整理數據、分析數據的方法。
    本書適合想通過R語言快速了解數據挖掘、預測分析、商業分析等領域的數據科學家和數據分析員閱讀,也適合高等院校數據挖掘相關專業師生和對數據挖掘感興趣的技術人員參考。

作者介紹
(意)安德烈亞·奇里洛|責編:余潔|譯者:王燕//王存?

目錄
第1章  為何選擇R語言
  1.1  什麼是R語言
  1.2  R語言的發展歷史
  1.3  R語言的優勢
    1.3.1  開源
    1.3.2  插件就緒
    1.3.3  數據可視化友好
  1.4  安裝R語言、編寫R語言代碼
    1.4.1  下載R語言軟體包
    1.4.2  應用於Windows平台和MacOS平台的R語言軟體包
    1.4.3  應用於Linux平台的R語言軟體包
    1.4.4  基礎版本R語言包安裝的主要組件
    1.4.5  編寫R語言及運行R語言代碼的替代平台
  1.5  R語言的基本概念
    1.5.1  R語言初級入門
    1.5.2  向量(Vector)
    1.5.3  列表(Lists)
    1.5.4  數據幀(Dataframes)
    1.5.5  函數(Functions)
  1.6  R語言的劣勢以及如何克服這些劣勢
    1.6.1  高效學習R語言,最小化精力投入
    1.6.2  通過R語言操作大型數據集
  1.7  更多參考
  1.8  小結
第2章  數據挖掘入門-讀者銀行賬戶數據分析
  2.1  獲取並準備銀行數據
    2.1.1  數據模型
  2.2  使用數據透視表匯總數據
    2.2.1  管道操作符簡介
    2.2.2  dplyr程序包簡介
    2.2.3  安裝必要程序包並將個人數據載入到R語言環境中
    2.2.4  確定每月和每天的費用總額
  2.4  使用ggplot2程序包對數據進行可視化處理
    2.4.1  數據可視化基本原理
    2.4.2  使用ggplot程序包來進行數據可視化
  2.5  更多參考
  2.6  小結
第3章  數據挖掘進階-數據挖掘標準流程(CRISP-DM)方法論
  3.1  數據挖掘標準流程(CRISP-DM)方法論之數據挖掘周期
  3.2  業務理解
  3.3  數據理解
    3.3.1  數據收集
    3.3.2  數據描述
    3.3.3  數據探索
  3.4  數據準備
  3.5  建模
    3.5.1  定義數據建模策略
  3.6  評估
    3.6.1  聚類評估
    3.6.2  分類評估

    3.6.3  回歸評估
    3.6.4  如何判斷模型性能的充分性
  3.7  部署
    3.7.1  部署計劃開發
    3.7.2  維護計劃開發
  3.8  小結
第4章  保持室內整潔-數據挖掘架構
  4.1  概述
  4.2  數據源
    4.2.1  數據源類型
  4.3  資料庫和數據倉庫
    4.3.1  中間層-數據集市
    4.3.2  單層架構的數據倉庫
    4.3.3  雙層架構的數據倉庫
    4.3.4  三層架構的數據倉庫
    4.3.5  實際應用的技術
  4.4  數據挖掘引擎
    4.4.1  解釋器
    4.4.2  引擎和數據倉庫之間的介面
    4.4.3  數據挖掘演算法
  4.5  用戶界面
    4.5.1  清晰性原則
  4.6  如何使用R語言來創建數據挖掘架構
    4.6.1  數據源
    4.6.2  數據倉庫
    4.6.3  數據挖掘引擎
    4.6.4  用戶界面
  4.7  更多參考
  4.8  小結
第5章  如何解決數據挖掘問題-數據清洗和驗證
  5.1  安靜祥和的一天
  5.2  數據清洗
    5.2.1  Tidydata框架
    5.2.2  分析數據的結構
    5.2.3  數據整理
    5.2.4  驗證數據
    5.2.5  數據合併
  5.3  更多參考
  5.4  小結
第6章  觀察數據-探索性數據分析
  6.1  匯總EDA介紹
    6.1.1  描述總體分佈
    6.1.2  測定變數之間的相關性
  6.2  圖形化EDA
    6.2.1  變數分佈可視化
    6.2.2  變數關係可視化
    6.2.3  更多參考
  6.3  小結
第7章  最初的猜想-線性回歸
  7.1  定義數據建模策略

    7.1.1  數據建模相關概念
  7.2  應用線性回歸
    7.2.1  線性回歸的直觀解釋
    7.2.2  線性回歸的數學原理
    7.2.3  如何在R語言中使用線性回歸
  7.3  更多參考
  7.4  小結
第8章  淺談模型性能評估
  8.1  定義模型性能
    8.1.1  模型的擬合度與模型的可解釋性
    8.1.2  使用模型進行預測
  8.2  測量回歸模型的性能
    8.2.1  均方誤差
    8.2.2  R平方
  8.3  衡量分類問題模型的性能
    8.3.1  混淆矩陣
    8.3.2  準確度
    8.3.3  靈敏度
    8.3.4  特異性
    8.3.5  如何選擇合適的性能統計指標
  8.4  區分訓練數據集與測試數據集
  8.5  更多參考
  8.6  小結
第9章  不要放棄-繼續學習包括多元變數的回歸
  9.1  從簡單線性回歸到多元線性回歸
    9.1.1  符號
    9.1.2  假設
  9.2  降維
    9.2.1  逐步回歸
    9.2.2  主成分回歸
  9.3  使用R語言擬合多元線性模型
    9.3.1  模型擬合
    9.3.2  變數的假設驗證
    9.3.3  殘差假設驗證
    9.3.4  降維
  9.4  更多參考
  9.5  小結
第10章  關於分類模型問題的不同展望
  10.1  分類模型是什麼?讀者為什麼需要分類模型
    10.1.1  線性回歸應用於分類變數的局限性
    10.1.2  常用的分類演算法和模型
  10.2  邏輯回歸
    10.2.1  邏輯回歸的原理
    10.2.2  邏輯回歸的數學原理
    10.2.3  如何在R中應用邏輯回歸
    10.2.4  邏輯回歸結果的可視化與解釋
  10.3  支持向量機(SVM)
    10.3.1  支持向量機的原支理
    10.3.2  在原R語言中應用支持向量機
    10.3.3  理解支持向量機的結果

  10.4  更多參考
  10.5  小結
第11章  最後衝刺-隨機森林和集成學習
  11.1  隨機森林
    11.1.1  隨機森林的構建模塊-決策樹簡介
    11.1.2  隨機森林的原理
    11.1.3  在R語言中應用隨機森林
    11.1.4  評估模型的結果
  11.2  集成學習
    11.2.1  基礎的集成學習技術
    11.2.2  採用R語言對數據進行集成學習
  11.3  在新數據上應用估計模型
    11.3.1  將predict.glm()函數用於邏輯模型的預測
    11.3.2  將predict.randomforest()用於隨機森林的預測
    11.3.3  將predict.svm()函數應用於支持向量機的預測
  11.4  結構化更加良好的預測分析方法
  11.5  對預測數據應用集成學習中的多數投票技術
  11.6  更多參考
  11.7  小結
第12章  尋找罪魁禍首-用R語言執行文本數據挖掘
  12.1  提取PDF文件中的數據
    12.1.1  獲取文檔列表
    12.1.2  通過pdf_text()函數將PDF文件讀取到R語言環境
    12.1.3  使用for循環迭代提取文本
  12.2  文本情感分析
  12.3  開發詞雲
  12.4  N元組模型(n-grams)分析
  12.5  網路分析
    12.5.1  從數據幀中獲取邊列表
    12.5.2  使用ggraph程序包可視化網路
  12.6  更多參考
  12.7  小結
第13章  借助RMarkdown與股東分享公司現狀
  13.1  富有說服力的數據挖掘報告之原則
    13.1.1  清晰闡明目標
    13.1.2  明確陳述假設
    13.1.3  數據處理過程清晰明了
    13.1.4  數據一致性
    13.1.5  提供數據譜系
  13.2  編製RMarkDown報告
  13.3  在RStudio中編製RMarkdown報告文檔
    13.3.1  Markdown簡介
    13.3.2  插入代碼塊
    13.3.3  通過內聯R語言代碼,在文本中重現代碼的輸出
    13.3.4  Shiny簡介以及reactivity框架
    13.3.5  添加互動式數據族譜模塊
  13.4  渲染和分享RMarkdown報告
    13.4.1  渲染RMarkdown報告
    13.4.2  分享RMarkdown報告
  13.5  更多參考

  13.6  小結
第14章  結語
附錄A  處理日期、相對路徑和函數
  A.1  使用R語言處理日期
  A.2  R語言中的工作目錄和相對路徑
  A.3  條件聲明

  • 商品搜索:
  • | 高級搜索
首頁新手上路客服中心關於我們聯絡我們Top↑
Copyrightc 1999~2008 美商天龍國際圖書股份有限公司 臺灣分公司. All rights reserved.
營業地址:臺北市中正區重慶南路一段103號1F 105號1F-2F
讀者服務部電話:02-2381-2033 02-2381-1863 時間:週一-週五 10:00-17:00
 服務信箱:bookuu@69book.com 客戶、意見信箱:cs@69book.com
ICP證:浙B2-20060032