幫助中心 | 我的帳號 | 關於我們

Hadoop簡明教程(普通高等教育人工智慧與大數據系列教材)

  • 作者:編者:劉科峰|責編:吉玲
  • 出版社:機械工業
  • ISBN:9787111719915
  • 出版日期:2023/07/01
  • 裝幀:平裝
  • 頁數:186
人民幣:RMB 39.8 元      售價:
放入購物車
加入收藏夾

內容大鋼
    本書以Hadoop 3.3.0為核心,涵蓋Hadoop生態系統的常用組件,主要介紹各組件的架構原理、Shell命令、常用API及編程等,並配有較多例題。全書共7章,內容包含Hadoop概述、Hadoop偽分散式安裝、Hadoop分散式文件系統HDFS、分散式計算框架MapReduce、分散式資料庫HBase、數據倉庫Hive和內存計算框架Spark,第2?7章還設計了相關實驗。
    本書可以作為高等院校大數據、電腦、應用統計等相關專業的教材,也可作為Hadoop愛好者的入門教程或自學參考用書。
    本書配有電子課件,歡迎選用本書作教材的教師登錄www.cmpedu.com註冊後下載,或加微信13910750469索取。

作者介紹
編者:劉科峰|責編:吉玲

目錄
前言
第1章  Hadoop概述
  1.1  大數據簡介
  1.2  Hadoop簡介
  1.3  Hadoop特性
  1.4  Hadoop核心組件
    1.4.1  HDFS
    1.4.2  MapReduce
    1.4.3  YARN
  1.5  Hadoop生態系統
    1.5.1  HBase
    1.5.2  Hive
    1.5.3  Pig
    1.5.4  Spark
    1.5.5  ZooKeeper
    1.5.6  Sqoop
    1.5.7  Flume
    1.5.8  Mahout
    1.5.9  Ambari
  1.6  本章小結
  習題
第2章  Hadoop偽分散式安裝
  2.1  Linux操作系統
    2.1.1  概述
    2.1.2  Linux的組成
    2.1.3  Linux的內核版本與發行版本
    2.1.4  Linux基本命令
  2.2  CentOS的安裝
    2.2.1  安裝VMware Workstation
    2.2.2  在VMware上安裝CentOS 7
    2.2.3  配置CentOS 7
  2.3  Hadoop偽分散式安裝與配置
    2.3.1  安裝WinSCP
    2.3.2  安裝JDK
    2.3.3  安裝Hadoop
  2.4  本章小結
  習題
  實驗  Hadoop偽分散式安裝與配置
第3章  Hadoop分散式文件系統HDFS
  3.1  HDFS的架構和原理
    3.1.1  電腦集群結構
    3.1.2  HDFS的假設前提和設計目標
    3.1.3  HDFS的相關概念
    3.1.4  HDFS體系結構
    3.1.5  HDFS存儲原理
  3.2  HDFS Shell
  3.3  HDFS Java API
    3.3.1  搭建Linux操作系統下的Eclipse開發環境
    3.3.2  HDFS Java API常用的類
    3.3.3  HDFS Java API編程

  3.4  本章小結
  習題
  實驗  HDFS基本命令的使用和HDFS的Java編程
第4章  分散式計算框架MapReduce
  4.1  認識MapReduce
    4.1.1  分散式並行編程
    4.1.2  MapReduce核心思想
    4.1.3  MapReduce運行環境
    4.1.4  Hadoop內置數據類型
  4.2  MapReduce工作流程
    4.2.1  MapReduce工作流程概述
    4.2.2  Shuffle過程分析
  4.3  MapReduce入門示例:WordCount
    4.3.1  WordCount程序任務
    4.3.2  準備被統計的文件
    4.3.3  WordCount執行過程分析
    4.3.4  WordCount編程實踐
  4.4  MapReduce應用實例
    4.4.1  求平均值
    4.4.2  簡單查詢功能的實現
  4.5  本章小結
  習題
  實驗  簡單排序的實現
第5章  分散式資料庫HBase
  5.1  概述
    5.1.1  BigTable簡介
    5.1.2  HBase簡介
    5.1.3  HBase具有的特點
  5.2  HBase數據模型
    5.2.1  數據模型概述
    5.2.2  數據模型的相關概念
  5.3  HBase系統架構
  5.4  HBase偽分散式安裝
    5.4.1  安裝並配置環境變數
    5.4.2  配置HBase參數
    5.4.3  驗證HBase
  5.5  HBase Shell
    5.5.1  HBase Shell常用命令
    5.5.2  HBase Shell應用實例
  5.6  HBase Java API
    5.6.1  HBase Java API簡介
    5.6.2  HBase Java API編程
  5.7  本章小結
  習題
  實驗  HBase編程實踐
第6章  數據倉庫Hive
  6.1  概述
    6.1.1  數據倉庫簡介
    6.1.2  Hive簡介
    6.1.3  Hive與關係型資料庫的區別

    6.1.4  Hive系統架構
  6.2  Hive偽分散式安裝
    6.2.1  MySQL的安裝和配置
    6.2.2  Hive的安裝和配置
  6.3  Hive編程基礎
    6.3.1  Hive的數據類型
    6.3.2  資料庫相關操作
    6.3.3  表相關操作
    6.3.4  表中數據的載入
    6.3.5  HiveQL基本查詢
    6.3.6  Hive函數
  6.4  Hive編程實例
    6.4.1  僱員表統計
    6.4.2  詞頻統計
  6.5  本章小結
  習題
  實驗  Hive的編程實踐
第7章  內存計算框架Spark
  7.1  Spark基礎知識
    7.1.1  Spark簡介
    7.1.2  Spark生態系統
    7.1.3  Spark運行架構
  7.2  Scala基礎知識
    7.2.1  Scala簡介
    7.2.2  Scala安裝
    7.2.3  Scala編程
  7.3  Spark偽分散式安裝
    7.3.1  Spark的安裝模式
    7.3.2  Spark的安裝
  7.4  RDD編程基礎
    7.4.1  Spark Shell的啟動和退出
    7.4.2  RDD創建
    7.4.3  常用的RDD操作
    7.4.4  RDD編程實例
  7.5  IDEA的安裝和使用
    7.5.1  IDEA的安裝
    7.5.2  IDEA的使用
    7.5.3  獨立應用程序實例
  7.6  本章小結
  習題
  實驗  Spark Shell互動式編程
參考文獻

  • 商品搜索:
  • | 高級搜索
首頁新手上路客服中心關於我們聯絡我們Top↑
Copyrightc 1999~2008 美商天龍國際圖書股份有限公司 臺灣分公司. All rights reserved.
營業地址:臺北市中正區重慶南路一段103號1F 105號1F-2F
讀者服務部電話:02-2381-2033 02-2381-1863 時間:週一-週五 10:00-17:00
 服務信箱:bookuu@69book.com 客戶、意見信箱:cs@69book.com
ICP證:浙B2-20060032