幫助中心 | 我的帳號 | 關於我們

R大數據分析實用指南

  • 作者:(英)西蒙·沃克威克|譯者:顧星竹//劉見康
  • 出版社:人民郵電
  • ISBN:9787115509253
  • 出版日期:2019/05/01
  • 裝幀:平裝
  • 頁數:373
人民幣:RMB 99 元      售價:
放入購物車
加入收藏夾

內容大鋼
    R是一個強大的、開源的、函數式編程語言,可以用於廣泛的編程任務。一般來講,R語言的應用主要在數據統計與分析、機器學習、高性能計算等方面。R語言已經在多個領域贏得了認可,同時也基於其開源、免費的特點不斷地發展壯大。
    本書通過9章內容,循序漸進地揭示了大數據的概念,介紹了如何使用R進行數據處理,如何創建Hadoop虛擬機,如何建立和部署SQL資料庫,同時還介紹了MongoDB、HBase、Spark、Hive相關的內容,並介紹了R的潛在應用場景。
    本書適合中級數據分析師、數據工程師、統計學家、研究人員和數據科學家閱讀,需要讀者具備數據分析、數據管理和大數據演算法的基本知識。

作者介紹
(英)西蒙·沃克威克|譯者:顧星竹//劉見康
    西蒙·沃克威克(Simon Walkowiak),是Mind Project公司的認知神經系統科學家和總經理,Mind Project公司是一家位於英國倫敦的大數據預測分析咨詢公司。在此之前,Simon是歐洲的社會經濟資料庫——英國科研數據服務(UKDS,位於埃塞克斯大學)的數據主管人。Simon在處理和管理大規模數據集方面擁有豐富的經驗,例如普查、感測器、智能電錶數據、電信數據和眾所周知的政治和社會調查。Simon在公共機構和國際公司開設了大量的數據科學和R培訓課程。他還在英國的幾所主要的大學以及由分析與數據科學研究所(Institute of Analytics and Data Science,IADS)組織的大數據分析暑期班教授大數據方法課程。

目錄
第1章  大數據時代
  1.1  大數據——重新定義怪物
  1.2  大數據工具箱——為大而生
    1.2.1  Hadoop——屋中之象
    1.2.2  資料庫
    1.2.3  Hadoop的Spark化
  1.3  R語言——大數據的無冕之王
  1.4  小結
第2章  R編程語言與統計環境的介紹
  2.1  學習R
  2.2  R語言基礎回顧
    2.2.1  準備R和RStudio
    2.2.2  R語言數據結構
    2.2.3  導出R數據對象
  2.3  應用數據科學與R
    2.3.1  導入不同格式的數據
    2.3.2  探索性數據分析
    2.3.3  數據聚合和列聯表
    2.3.4  假設檢驗和統計推斷
    2.3.5  數據可視化包
  2.4  小結
第3章  由內而外釋放R的力量
  3.1  R的傳統局限性
    3.1.1  內存外的數據
    3.1.2  處理速度
  3.2  超越內存限制
    3.2.1  使用ff和ffbase軟體包進行數據轉換和聚合
    3.2.2  使用ff和ffbase包的廣義線性模型
    3.2.3  使用bigmemory包擴展內存
  3.3  R的並行
    3.3.1  從bigmemory到更快的計算
    3.3.2  未來的R並行處理
  3.4  使用data.table包和其他工具提高R性能
    3.4.1  使用data.table包快速數據導入和操作
    3.4.2  編寫更好的R代碼
  3.5  小結
第4章  R相關的Hadoop和MapReduce框架
  4.1  Hadoop架構
    4.1.1  Hadoop分散式文件系統
    4.1.2  MapReduce框架
    4.1.3  其他Hadoop原生工具
    4.1.4  學習Hadoop
  4.2  雲上的單節點Hadoop
    4.2.1  在Azure上部署Hortonworks Sandbox
    4.2.2  Java語言的Hadoop單詞記數示例
    4.2.3  R語言的Hadoop單詞記數示例
  4.3  HDInsight——Azure上的多節點Hadoop集群
    4.3.1  創建第一個HDInsight集群
    4.3.2  智能電錶數據分析示例——在HDInsight集群上使用R
  4.4  小結

第5章  R與關係型資料庫管理系統(RDBMS)
  5.1  關係型資料庫管理系統(RDBMS)
    5.1.1  常用RDBMS簡介
    5.1.2  結構化查詢語言(SQL)
  5.2  用SQLite 連接R
    5.2.1  準備並導入數據到本地SQLite資料庫
    5.2.2  通過RStudio連接SQLite資料庫
  5.3  在Amazon EC2實例中連接MariaDB和R
    5.3.1  準備EC2實例和RStudio伺服器
    5.3.2  準備MariaDB和數據
    5.3.3  連接MariaDB和RStudio
  5.4  連接Amazon RDS上的PostgreSQL和R
    5.4.1  啟動一個Amazon RDS資料庫實例
    5.4.2  準備並上傳數據到Amazon RDS上
    5.4.3  從RStudio遠程查詢Amazon RDS上的PostgreSQL
  5.5  小結
第6章  R與非關係型資料庫
  6.1  NoSQL資料庫簡介
  6.2  用R操作MongoDB
    6.2.1  MongoDB簡介
    6.2.2  在Amazon EC2上安裝MongoDB並與R連接
    6.2.3  使用MongoDB和R處理大數據
  6.3  Hbase與R
    6.3.1  Azure HDInsight與HBase和RStudio Server
    6.3.2  將數據導入HDFS和HBase
    6.3.3  使用rhbase包讀取和查閱Hbase
  6.4  小結
第7章  比Hadoop更快——使用R編寫Spark
  7.1  為大數據分析服務的Spark
  7.2  多節點HDInsight集群上使用R的Spark
    7.2.1  部署使用支持Spark和R/RStudio的HDInsight
    7.2.2  將數據讀入HDFS和Hive
    7.2.3  使用SparkR分析灣區共享單車數據
  7.3  小結
第8章  R語言大數據機器學習
  8.1  機器學習是什麼
    8.1.1  機器學習演算法
    8.1.2  監督和無監督機器學習方法
    8.1.3  分類和聚類演算法
    8.1.4  R機器學習方法
    8.1.5  大數據機器學習工具
  8.2  在HDInsight集群中使用Spark和R的GLM示例
    8.2.1  準備Spark群集並從HDFS讀取數據
    8.2.2  Spark中的R語言邏輯回歸
  8.3  R中基於Hadoop H2O的樸素貝葉斯
    8.3.1  在R中運行Hadoop上的H2O實例
    8.3.2  讀取和探索H2O中的數據
    8.3.3  R中基於H2O的樸素貝葉斯
  8.4  R中基於Hadoop H2O的神經網路
    8.4.1  神經網路的工作原理

    8.4.2  在H2O上運行神經網路模型
  8.5  小結
第9章  R語言的未來——大數據、快數據、智能數據
  9.1  R大數據分析的現狀
    9.1.1  超過單機內存的數據
    9.1.2  更快的R數據處理
    9.1.3  Hadoop與R
    9.1.4  Spark與R
    9.1.5  R與資料庫
    9.1.6  機器學習與R
  9.2  R的未來
    9.2.1  大數據
    9.2.2  快數據
    9.2.3  智能數據
  9.3  如何提升
  9.4  小結

  • 商品搜索:
  • | 高級搜索
首頁新手上路客服中心關於我們聯絡我們Top↑
Copyrightc 1999~2008 美商天龍國際圖書股份有限公司 臺灣分公司. All rights reserved.
營業地址:臺北市中正區重慶南路一段103號1F 105號1F-2F
讀者服務部電話:02-2381-2033 02-2381-1863 時間:週一-週五 10:00-17:00
 服務信箱:bookuu@69book.com 客戶、意見信箱:cs@69book.com
ICP證:浙B2-20060032