幫助中心 | 我的帳號 | 關於我們

深入淺出R語言數據分析(新時代技術新未來)

  • 作者:編者:米霖|責編:劉洋
  • 出版社:清華大學
  • ISBN:9787302543886
  • 出版日期:2020/09/01
  • 裝幀:平裝
  • 頁數:257
人民幣:RMB 69 元      售價:
放入購物車
加入收藏夾

內容大鋼
    本書首先介紹數據分析的方法論,然後介紹數據分析的相關模型方法,並進一步通過數據分析案例,講解數據分析的思維、方法及模型實現過程。本書重點介紹R語言在數據分析方面的應用,讓讀者能夠快速地使用R語言進行數據分析、構建模型。
    本書分為17章,內容包括:使用R語言獲取數據、數據分析中的數據處理與數據探索、生存分析、主成分分析、多維縮放、線性回歸模型、邏輯回歸模型、聚類模型、關聯規則、隨機森林、支持向量機、神經網路、文本挖掘、社交網路分析,以及H20機器學習和R語言爬蟲這兩個關於R語言數據分析的兩個延伸內容。    、
    本書內容通俗易懂,案例豐富,實用性強,特別適合R語言的入門讀者和進階讀者閱讀,也適合數據分析人員、數據挖掘人員等其他數據科學從業者。另外,本書也適合統計學、電腦、機器學習、數學等相關專業的本科生、研究生使用。

作者介紹
編者:米霖|責編:劉洋
    米霖,畢業於華中農業大學,本科數學專業,研究生統計學專業,8年R語言項目經驗,擅長機器學習、統計模型。曾開發了多門R語言相關課程,課程包括「Shiny初級教程」「R包開發」「H2O機器學習模型」「信用評分模型開發」「R語言文本挖掘」等,學員累計超過5000人。完成過很多數據分析項目,例如廣告虛假流量識別項目(通過虛假流量數據的挖掘幫助企業節省了上百萬元的營銷成本)、信貸中的信用評分項目、電商風控項目等。

目錄
第1章  數據分析項目的流程
  1.1  數據分析項目中的角色
  1.2  數據分析項目的階段
    1.2.1  制定目標
    1.2.2  收集數據
    1.2.3  數據處理和分析
    1.2.4  構建模型
    1.2.5  評估模型
    1.2.6  展示結果
    1.2.7  部署與維護模型
  1.3  總結
第2章  數據的讀取
  2.1  RData數據
  2.2  readr高效讀取數據
  2.3  讀取Excel數據
  2.4  讀取SPSS、SAS、STATA數據
  2.5  R語言操作資料庫
  2.6  總結
第3章  數據探索
  3.1  缺失值的識別與處理
    3.1.1  缺失值的識別與描述性統計
    3.1.2  缺失值的可視化展示
    3.1.3  缺失值的處理方法
  3.2  異常值
  3.3  dlookr數據處理包
    3.3.1  所有變數的一般性診斷
    3.3.2  數值型變數的診斷
    3.3.3  分類變數的診斷
    3.3.4  異常值的診斷
    3.3.5  創建診斷報告
    3.3.6  數據處理
    3.3.7  缺失值處理
    3.3.8  異常值處理
    3.3.9  數據轉換
    3.3.10  數據分箱
    3.3.11  創建數據轉換報告
  3.4  數據相關性
  3.5  自動化創建數據探索報告
  3.6  總結
第4章  生存分析
  4.1  生存分析的基本內容
  4.2  使用R語言進行生存分析
  4.3  非參數模型
    4.3.1  使用Kaplan-Meier方法擬合數據
    4.3.2  Kaplan-Meier方法的可視化
  4.4  半參數模型生存分析方法
    4.4.1  構建Cox模型
    4.4.2  檢查假設
    4.4.3  Coxph模型可視化
    4.4.4  預測

    4.4.5  分層
  4.5  參數模型
  4.6  隨機生存森林模型
  4.7  總結
第5章  主成分分析
  5.1  概述
    5.1.1  維度相關的問題
    5.1.2  檢測多重共線性
    5.1.3  方差膨脹因子
  5.2  主成分分析詳解
    5.2.1  主成分分析的定義
    5.2.2  主成分分析的簡單原理
    5.2.3  主成分分析的演算法
  5.3  使用R語言進行主成分分析
    5.3.1  主成分分析的實現
    5.3.2  主成分分析案例
  5.4  總結
第6章  多維縮放
  6.1  MDS的工作原理
  6.3  MDS的優點
  6.2  在R語言中實現MDS
  6.4  總結
第7章  線性回歸模型
  7.1  線性回歸模型概述
  7.2  在R語言中實現回歸模型
    7.2.1  圖形分析
    7.2.2  建立線性模型
    7.2.3  回歸模型的圖形診斷
    7.2.4  預測模型
    7.2.5  抽樣方法
  7.3  總結
第8章  邏輯回歸模型
  8.1  邏輯回歸的原理
  8.2  在R語言中實現邏輯回歸模型
    8.2.1  數據探索
    8.2.2  構建邏輯回歸模型
    8.2.3  邏輯回歸預測
    8.2.4  邏輯回歸模型評估
  8.3  總結
第9章  聚類模型
  9.1  概述
    9.1.1  聚類演算法
    9.1.2  K均值聚類的原理
  9.2  在R語言中實現聚類模型
    9.2.1  K均值聚類
    9.2.2  層次聚類
    9.2.3  Medoids聚類(PAM)
  9.3  總結
第10章  關聯規則
  10.1  關聯規則概述

  10.2  關聯規則的基本概念
  10.3  在R語言中實現關聯規劃
    10.3.1  訓練模型
    10.3.2  模型的評估
    10.3.3  提升關聯規則的效果
    10.3.4  關聯規則的可視化
  10.4  總結
第11章  隨機森林
  11.1  隨機森林的基本概念
  11.3  總結
  11.2  在R語言中實現隨機森林
第12章  支持向量機
  12.1  概述
  12.3  總結
  12.2  在R語言中實現支持向量機
第13章  神經網路
    13.2.2  評估模型效果
  13.1  概述
  13.2  在R語言中實現神經網路
  13.3  總結
    13.2.1  構建神經網路模型
第14章  文本挖掘
  14.1  概述
  14.2  text2vec背景及其基本原理
  14.3  DTM與TFIDF的原理和實現
    14.3.1  DTM和TFIDF的原理
    14.3.2  DTM的實現
    14.3.3  TFIDF的實現
  14.4  情感分析
  14.5  LDA主題模型及其實現
  14.6  構建自動問答系統
  14.7  總結
第15章  社交網路分析
  15.1  社交網路概述
  15.2  igraph簡介
    15.2.1  準備工作
    15.2.2  圖的指標計算
  15.3  社交網路的常見結構
  15.4  社交網路分析演算法
IX
    15.4.1  Girvan-Newman
    15.4.2  基於傳播標籤的社區檢測
    15.4.3  基於貪婪優化模塊的社區檢測
    15.4.4  自旋轉玻璃社群
  15.5  微博社交群體分析
    15.5.1  自旋轉玻璃社群
    15.5.2  社群檢測
  15.6  總結
第16章  H2O機器學習
  16.1  H2O機器學習平台

  16.2  在R語言中使用H2O
    16.2.1  H2O的安裝
    16.2.2  案例應用
    16.2.3  H2O常用API
    16.2.4  模型的通用參數
    16.2.5  參數調整
  16.3  H2OFlow
    16.3.1  H2OFlow的安裝
    16.3.2  H2OFlow的基本使用方法
  16.4  總結
第17章  R語言爬蟲
  17.1  快速爬取網頁數據
  17.2  rvest簡介
    17.2.1  rvestAPI
    17.2.2  rvestAPI詳解
  17.3  爬取BOSS直聘數據
  17.4  模擬登錄

  • 商品搜索:
  • | 高級搜索
首頁新手上路客服中心關於我們聯絡我們Top↑
Copyrightc 1999~2008 美商天龍國際圖書股份有限公司 臺灣分公司. All rights reserved.
營業地址:臺北市中正區重慶南路一段103號1F 105號1F-2F
讀者服務部電話:02-2381-2033 02-2381-1863 時間:週一-週五 10:00-17:00
 服務信箱:bookuu@69book.com 客戶、意見信箱:cs@69book.com
ICP證:浙B2-20060032