幫助中心 | 我的帳號 | 關於我們

R語言大數據分析與挖掘/新工科新商科大數據與商務智能系列

  • 作者:編者:謝笑盈//金康偉|責編:王二華
  • 出版社:電子工業
  • ISBN:9787121452383
  • 出版日期:2023/03/01
  • 裝幀:平裝
  • 頁數:271
人民幣:RMB 55 元      售價:
放入購物車
加入收藏夾

內容大鋼
    本書首先簡要介紹了大數據分析與挖掘的相關概念,以及R語言的基礎知識,以此來幫助讀者了解、使用R語言;其次詳細介紹了探索性數據分析、數據採集,以此來幫助讀者了解數據的基本分析方法和數據的獲取方法;然後著重介紹了目前主流的數據挖掘演算法——時間序列演算法、線性回歸演算法、分類演算法、關聯演算法、聚類演算法,從演算法的原理到如何使用R語言進行演算法實現都進行了詳細的介紹並提供了實操代碼,以此幫助讀者學習數據挖掘及使用R語言完成數據挖掘任務;最後通過6個旅遊行業的實際案例來幫助讀者將學習到的知識運用到真實的業務場景中,並融會貫通整個知識體系。
    本書無須讀者具備R語言和大數據分析與挖掘的基礎知識。無論是R語言初學者,還是熟練的R語言用戶,都能從本書中找到有用的內容。本書既可以作為一本學習R語言的教材,也可以作為大數據分析與挖掘的工具書。

作者介紹
編者:謝笑盈//金康偉|責編:王二華

目錄
第1章  大數據分析與挖掘概論
  1.1  大數據分析與挖掘
    1.1.1  大數據定義
    1.1.2  大數據分析與挖掘的概念
  1.2  大數據分析與挖掘流程
    1.2.1  數據獲取
    1.2.2  數據預處理
    1.2.3  數據分析
    1.2.4  數據解釋
  1.3  大數據分析與挖掘應用
    1.3.1  優化任務
    1.3.2  預測任務
    1.3.3  分類任務
    1.3.4  識別任務
第2章  R語言編程基礎
  2.1  R語言的安裝及配置
    2.1.1  R語言的獲取和安裝
    2.1.2  RStudio的獲取和安裝
  2.2  界面與菜單
    2.2.1  RGui界面
    2.2.2  RStudio界面
  2.3  變數與數據類型
    2.3.1  變數
    2.3.2  數據類型
  2.4  數據結構
    2.4.1  向量
    2.4.2  數組
    2.4.3  矩陣
    2.4.4  列表
    2.4.5  數據框
    2.4.6  因子
  2.5  控制語句
    2.5.1  條件語句
    2.5.2  循環語句
  2.6  函數
    2.6.1  內置函數
    2.6.2  自定義函數
第3章  數據預處理
  3.1  數據表的基本操作
    3.1.1  數據表保存
    3.1.2  數據表讀取
    3.1.3  選取子集
    3.1.4  連接資料庫
  3.2  數據分組、分割、合併和變形
    3.2.1  數據分組
    3.2.2  數據分割
    3.2.3  數據合併
    3.2.4  數據變形
  3.3  缺失值、異常值、重複值處理
    3.3.1  缺失值

    3.3.2  異常值
    3.3.3  重複值
  3.4  數據類型的轉換
    3.4.1  判斷數據類型函數
    3.4.2  轉換數據類型的函數
  3.5  提取字元
    3.5.1  截取字元
    3.5.2  正則表達式
第4章  探索性數據分析
  4.1  描述性統計方法
    4.1.1  常用統計指標
    4.1.2  數據總結
  4.2  數據可視化
    4.2.1  箱線圖
    4.2.2  直方圖
    4.2.3  散點圖
    4.2.4  餅圖
第5章  數據採集
  5.1  網路數據採集的原理
    5.1.1  網頁通信的過程
    5.1.2  請求數據的方法
    5.1.3  網頁的組成元素
  5.2  數據採集入門
    5.2.1  數據採集常用包概述
    5.2.2  數據採集前的準備
    5.2.3  編寫第一個數據採集
  5.3  使用常用的R包採集數據
    5.3.1  使用RCurl包獲取網路數據
    5.3.2  使用rvest包獲取網路數據
    5.3.3  使用httr包獲取網路數據
  5.4  爬蟲限制處理
    5.4.1  解決IP限制問題
    5.4.2  驗證碼處理
    5.4.3  登錄問題處理
第6章  時間序列演算法
  6.1  時間序列演算法概述
    6.1.1  時序對象
    6.1.2  時序平滑處理
    6.1.3  時序季節性分解
  6.2  時序指數模型
  6.3  時序ARIMA模型
第7章  線性回歸演算法
  7.1  一元線性回歸模型
  7.2  多項式回歸模型
  7.3  多元線性回歸模型
第8章  分類演算法
  8.1  Logistic回歸
    8.1.1  Logistic回歸演算法原理
    8.1.2  邏輯回歸演算法應用
  8.2  決策樹

    8.2.1  決策樹演算法原理
    8.2.2  決策樹演算法應用
  8.3  支持向量機
    8.3.1  支持向量機演算法原理
    8.3.2  支持向量機演算法應用
  8.4  樸素貝葉斯
    8.4.1  貝葉斯定理
    8.4.2  最大似然估計
    8.4.3  樸素貝葉斯分類演算法原理
    8.4.4  樸素貝葉斯分類演算法應用
  8.5  人工神經網路
    8.5.1  人工神經網路的基本概念
    8.5.2  感知器和人工神經元模型
    8.5.3  前饋神經網路
    8.5.4  人工神經網路演算法應用
  8.6  隨機森林
    8.6.1  隨機森林演算法原理
    8.6.2  隨機森林演算法應用
  8.7  XGBoost演算法
    8.7.1  XGBoost演算法的原理
    8.7.2  XGBoost演算法應用
第9章  關聯演算法
  9.1  關聯演算法概述
    9.1.1  相關名詞
    9.1.2  關聯規則及頻繁項集的產生
  9.2  Apriori演算法
    9.2.1  Apriori演算法概述
    9.2.2  先驗原理
    9.2.3  連接步和剪枝步
    9.2.4  Apriori演算法流程
    9.2.5  Apriori演算法實例
  9.3  ECLAT演算法
    9.3.1  ECLAT演算法概述
    9.3.2  ECLAT演算法流程
    9.3.3  ECLAT演算法實例
第10章  聚類演算法
  10.1  聚類演算法概述
    10.1.1  聚類演算法的類型
    10.1.2  聚類演算法評估的特點
  10.2  K均值聚類演算法
    10.2.1  劃分方法概述
    10.2.2  K均值聚類演算法的優缺點
    10.2.3  K均值聚類演算法的流程
    10.2.4  K均值聚類分析案例
  10.3  凝聚式層次聚類演算法
    10.3.1  凝聚式層次聚類概述
    10.3.2  凝聚式層次聚類演算法流程
    10.3.3  凝聚式層次聚類演算法實例
【應用案例1】景點輿情數據採集
【應用案例2】旅遊電商平台數據採集

【應用案例3】旅遊網站景點路線推薦
【應用案例4】旅遊城市和景點的負荷預測
【應用案例5】精品旅行服務成單預測
【應用案例6】航班延誤預測

  • 商品搜索:
  • | 高級搜索
首頁新手上路客服中心關於我們聯絡我們Top↑
Copyrightc 1999~2008 美商天龍國際圖書股份有限公司 臺灣分公司. All rights reserved.
營業地址:臺北市中正區重慶南路一段103號1F 105號1F-2F
讀者服務部電話:02-2381-2033 02-2381-1863 時間:週一-週五 10:00-17:00
 服務信箱:bookuu@69book.com 客戶、意見信箱:cs@69book.com
ICP證:浙B2-20060032