幫助中心 | 我的帳號 | 關於我們

Hadoop大數據平台構建與應用(高等職業教育大數據技術與應用系列規劃教材)

  • 作者:編者:王傳東//盧?//馬榮飛|責編:徐建軍
  • 出版社:電子工業
  • ISBN:9787121380822
  • 出版日期:2020/03/01
  • 裝幀:平裝
  • 頁數:238
人民幣:RMB 46 元      售價:
放入購物車
加入收藏夾

內容大鋼
    本書基於Hadoop大數據平台,講解大數據平台的搭建與運維、大數據的採集與存儲、大數據的處理、數據分析、數據可視化等完整的大數據應用案例,全面詳細地講述Hadoop、MapReduce、HDFS、Hive、Spark和Zookecpcr等技術的相關知識,詳細介紹Hadoop大數據集群環境配置與搭建、部署配置Hadoop HA模式等內容。
    本書具有較強的實用性和可操作性,語言精練,通俗易懂,操作步驟詳盡,並配有大量操作圖例。
    高等職業院校大數據應用技術專業、軟體技術專業、雲計算技術與應用專業可以將本書作為教材,從事大數據分析、雲計算應用等系統開發與分析的技術人員也可以將本書作為參考用書。

作者介紹
編者:王傳東//盧?//馬榮飛|責編:徐建軍

目錄
第1章  大數據與Hadoop平台技術
  1.1  大數據時代
  1.2  大數據關鍵技術
  1.3  大數據涉及的主要軟體
  1.4  Hadoop平台技術的生態
第2章  Ubuntu系統的安裝與使用
  2.1  Linux系統簡介
  2.2  Ubuntu系統安裝
    2.2.1  下載虛擬機軟體VMware並安裝
    2.2.2  在虛擬機中安裝Ubuntu系統
    2.2.3  切換中英文輸入法
    2.2.4  安裝VMware Tools
    2.2.5  apt更新與更新源更換
    2.2.6  安裝vim編輯器並使用
  2.3  虛擬機聯網問題及其他
第3章  Linux基礎知識及相關軟體的基本使用
  3.1  Linux基礎知識
    3.1.1  Linux目錄結構
    3.1.2  Shell介紹
    3.1.3  超級用戶——root用戶
    3.1.4  sudo命令和su命令
    3.1.5  創建與刪除普通用戶
    3.1.6  目錄標記規則
    3.1.7  目錄許可權
    3.1.8  安裝SSH
  3.2  Linux常用軟體與命令
    3.2.1  修改主機名
    3.2.2  目錄操作
    3.2.3  查看文件內容和清屏
    3.2.4  文件操作
    3.2.5  文件解壓
    3.2.6  進程與埠查看命令
    3.2.7  系統管理命令
    3.2.8  數據流重定向和管道的使用
    3.2.9  其他使用技巧介紹
  3.3  在Ubuntu中安裝Eclipse
    3.3.1  通過軟體中心下載安裝Eclipse
    3.3.2  在桌面創建Eclipse快捷方式
第4章  Hadoop的偽分散式安裝與使用
  4.1  深入了解Hadoop
    4.1.1  Hadoop發行版本介紹
    4.1.2  Hadoop核心架構
    4.1.3  Hadoop的主要應用場景
  4.2  安裝Java環境
    4.2.1  離線安裝
    4.2.2  在線安裝
  4.3  安裝Hadoop
    4.3.1  下載Hadoop安裝文件並解壓
    4.3.2  配置Hadoop環境變數
    4.3.3  偽分散式模式配置

    4.3.4  Hadoop無法正常啟動和使用的解決方法
第5章  HDFS
  5.1  HDFS基本知識
    5.1.1  DFS簡介
    5.1.2  HDFS
    5.1.3  HDFS存儲數據
  5.2  Shell命令與HDFS交互操作
    5.2.1  Hadoop Shell命令方式
    5.2.2  目錄操作
    5.2.3  文件操作
    5.2.4  利用Web界面管理HDFS
  5.3  Java編程與HDFS實現交互
    5.3.1  在Eclipse中創建HDFS交互Java項目
    5.3.2  在Java項目中編寫Java應用程序代碼
    5.3.3  編譯運行程序與打包
    5.3.4  練習中使用的代碼文件
第6章  HBase偽分佈部署與使用
  6.1  HBase介紹
  6.2  安裝HBase
  6.3  偽分佈HBase環境搭建
  6.4  HBase Shell常用操作命令實踐
    6.4.1  HBase表結構舉例說明和常用的表操作命令
    6.4.2  在HBase中創建表和刪除表
    6.4.3  HBase資料庫基本操作
第7章  MapReduce原理與基礎編程
  7.1  MapReduce介紹與基本原理
    7.1.1  MapReduce在現實生活中的運用
    7.1.2  通過案例拆解MapReduce的工作過程
    7.1.3  MapReduce工作流程概括
  7.2  MapReduce編程思路
  7.3  MapReduce編程實例1:WordCount
  7.4  MapReduce編程實例2:計算學生的平均成績
第8章  數據倉庫Hive偽分散式部署與使用
  8.1  Hive的特點
  8.2  Hive偽分散式部署
    8.2.1  安裝配置Hive
    8.2.2  安裝配置MySQL,連接Hive元資料庫
  8.3  MySQL資料庫操作
    8.3.1  常用命令介紹
    8.3.2  無法登錄MySQL Shell的解決方法
第9章  數據分析與Hive資料庫操作
  9.1  Hive操作命令介紹
  9.2  HQL中的Case命令用法介紹
  9.3  電商網站日誌數據分析與達成目標
  9.4  數據分析實現
    9.4.1  將網站日誌文件集載入到Hive中
    9.4.2  統計分析網站日誌數據
    9.4.3  統計詞頻
第10章  Spark的安裝與基礎編程
  10.1  Spark的安裝(Python版)

    10.1.1  下載Spark安裝軟體
    10.1.2  安裝與配置Spark
    10.1.3  在PySpark中運行代碼
    10.1.4  Spark獨立應用程序編程示例
  10.2  Spark的一些基本概念
  10.3  RDD編程操作
    10.3.1  RDD操作的兩種類型
    10.3.2  創建RDD
    10.3.3  創建鍵值對RDD
  10.4  從RDD到DataFrame
    10.4.1  Spark SQL和DataFrame
    10.4.2  創建樣例數據文件
    10.4.3  讀取json和csv文件生成DataFrame
    10.4.4  普通文本文件生成DataFrame
  10.5  Spark綜合編程與Python可視化
    10.5.1  Spark綜合編程
    10.5.2  Python可視化呈現
第11章  Hadoop集群環境搭建
  11.1  克隆Linux虛擬機
  11.2  橋接模式與NAT模式
    11.2.1  橋接模式
    11.2.2  NAT模式
  11.3  VMware Workstation橋接網路配置
    11.3.1  集群網路配置實現的目標
    11.3.2  設置網路橋接模式
    11.3.3  驗證
  11.4  大數據集群環境配置與搭建
    11.4.1  修改主機名,並將主機名與IP地址建立映射
    11.4.2  集群SSH免密登錄
    11.4.3  時間同步
第12章  Zookeeper與集群Hadoop安裝應用
  12.1  Zookeeper介紹
    12.1.1  Zookeeper的作用
    12.1.2  Zookeeper選舉機制
  12.2  安裝Zookeeper
    12.2.1  為安裝Zookeeper的目錄賦權
    12.2.2  下載、解壓Zookeeper安裝包
    12.2.3  修改Zookeeper配置文件zoo.cfg
    12.2.4  創建zkdata和zkdatalog文件夾
    12.2.5  創建文件myid
    12.2.6  配置環境變數
    12.2.7  遠程複製分發
    12.2.8  啟動Zookeeper集群
    12.2.9  Zookeeper啟動錯誤及解決方法
  12.3  在集群上安裝Hadoop
  12.4  在集群上安裝HBase
第13章  構建集群數據倉庫
  13.1  在slave2節點上安裝MySQL Server
  13.2  在slave1節點上安裝Hive伺服器
  13.3  將master節點作為Hive客戶端

  13.4  啟動Hive
第14章  Hadoop從完全分散式到HA的安裝與使用
  14.1  Hadoop HA
    14.1.1  HDFS HA背景
    14.1.2  HDFS HA架構
  14.2  安裝虛擬機系統
    14.2.1  在VMware中創建虛擬機
    14.2.2  安裝CentOS 7
    14.2.3  設置網路靜態IP地址
    14.2.4  克隆3台虛擬機
  14.3  使用XShell 6登錄CentOS虛擬機
  14.4  修改各節點主機名稱並配置SSH免密
    14.4.1  修改各節點的虛擬機主機名
    14.4.2  主機名與IP地址映射
    14.4.3  SSH免密設置
  14.5  安裝JDK
  14.6  安裝並配置Zookeeper
    14.6.1  安裝Zookeeper
    14.6.2  啟動和停止Zookeeper
  14.7  安裝並配置為完全分散式Hadoop集群
    14.7.1  上傳、解壓文件並配置環境變數
    14.7.2  將Hadoop配置為完全分散式集群
  14.8  部署配置Hadoop HA模式
    14.8.1  編輯Hadoop HA配置文件
    14.8.2  分發文件
    14.8.3  第一次啟動HA
    14.8.4  常規啟動HA
    14.8.5  Hadoop HA部署完成之後的常規啟停順序
    14.8.6  在HA集群上測試wordcount程序

  • 商品搜索:
  • | 高級搜索
首頁新手上路客服中心關於我們聯絡我們Top↑
Copyrightc 1999~2008 美商天龍國際圖書股份有限公司 臺灣分公司. All rights reserved.
營業地址:臺北市中正區重慶南路一段103號1F 105號1F-2F
讀者服務部電話:02-2381-2033 02-2381-1863 時間:週一-週五 10:00-17:00
 服務信箱:bookuu@69book.com 客戶、意見信箱:cs@69book.com
ICP證:浙B2-20060032