幫助中心 | 我的帳號 | 關於我們

大數據原理及實踐(高等教育十四五經管類精品教材)

  • 作者:編者:張曉燕//王筱莉//李躍文//謝妍曦|責編:台嘯天
  • 出版社:上海財大
  • ISBN:9787564239091
  • 出版日期:2023/03/01
  • 裝幀:平裝
  • 頁數:203
人民幣:RMB 39 元      售價:
放入購物車
加入收藏夾

內容大鋼
    本書分為八章。第一章介紹Hadoop生態系統及其發展歷程。大家可以通過此章內容了解到Hadoop是一個開放的生態系統,裡面有很多項目組成,包括數據採集類的項目、數據處理類的項目和數據可視化類的項目等;第二章介紹Hadoop的核心組件,包括HDFS、MapReduce和Yarn,通過此章的學習。大家可以了解到Hadoop 三大核心組件的基本組成及運行原理;第三章介紹Ha-doop集群環境的搭建。本教材選用Cloudera版本(Cloudera's Distribution In-cluding Apache Hadoop,CDH)作為集群安裝,在介紹集群安裝之前普及一些Linux 常用的命令,為安裝做技術鋪墊;第四章主要介紹Hadoop 生態系統中非常常用、非常實用又簡單易用的Hive組件,介紹其原理及安裝方法;第五章主要介紹Hive的使用,了解Hive中DDL和DML語法知識(通過前面五章的學習。大家可以獨立搭建Hadoop集群,並上傳文件到HDFS中,並且利用Ma-pReduce 或者 Hive 對數據文件進行統計分析);第六章進入Hadoop 生態系統中內存計算的學習,選用Spark組件,著重介紹Spark的內存計算的原理及運行模式;第七章介紹Spark 的編程及SparkSQL的使用。通過這兩部分的學習,大家可以完成Spark的安裝部署,了解Spark的適用場合,學會Spark編程和SparkSQL對數據進行分析;第八章為SparkMLLib的內容。通過這一章的學習,大家可以利用SparkMLLib完成較複雜的一些數據分析,例如分類、聚類和關聯分析等。通過本教材的學習,大家可以從零基礎開始了解大數據平台,能夠完成利用相關組件進行簡單或複雜的數據分析的任務。

作者介紹
編者:張曉燕//王筱莉//李躍文//謝妍曦|責編:台嘯天

目錄
第1章  Hadoop生態系統簡介
  1.1  大數據發展
  1.2  Hadoop平台介紹
  1.3  相關的公司
  1.4  Hadoop生態系統
第2章  Hadoop核心組件及其基本原理
  2.1  HDFS基本原理
  2.2  MapReduce分散式計算框架
  2.3  Yarn介紹
第3章  Hadoop環境搭建
  3.1  Linux基礎
  3.2  Linux的文件系統結構
  3.3  文件類型
  3.4  Linux基本操作命令
  3.5  Linux下常用的工具軟體
  3.6  Hadoop環境搭建
第4章  Hive基本原理及安裝部署
  4.1  Hive基本原理
  4.2  Hive的數據存儲
  4.3  Hive的安裝部署
第5章  Hive的基本操作
  5.1  Hive的DDL(data define language)操作
  5.2  Hive的DML(data managed language)操作
  5.3  Hive shell 參數
第6章  Spark基礎知識
  6.1  Spark原理
  6.2  Spark架構及生態
  6.3  Spark運行流程及特點
  6.4  Spark運行模式
第7章  Spark RDD編程
  7.1  RDD設計與運行原理
  7.2  RDD基本操作
  7.3  Spark SQL簡介
第8章  基於MLLIB機器學習
  8.1  概述
  8.2  Spark分類和預測
  8.3  決策樹演算法
  8.4  樸素貝葉斯演算法
  8.5  回歸分析與預測技術
  8.6  聚類分析
  8.7  k-means聚類演算法簡介
  8.8  DBSCAN聚類演算法簡介
  8.9  關聯規則分析簡介
  8.10  Apriori演算法和FP Tree演算法簡介
參考文獻

  • 商品搜索:
  • | 高級搜索
首頁新手上路客服中心關於我們聯絡我們Top↑
Copyrightc 1999~2008 美商天龍國際圖書股份有限公司 臺灣分公司. All rights reserved.
營業地址:臺北市中正區重慶南路一段103號1F 105號1F-2F
讀者服務部電話:02-2381-2033 02-2381-1863 時間:週一-週五 10:00-17:00
 服務信箱:bookuu@69book.com 客戶、意見信箱:cs@69book.com
ICP證:浙B2-20060032