幫助中心 | 我的帳號 | 關於我們

Hadoop大數據處理與分析教程(慕課版信息技術人才培養系列規劃教材)

  • 作者:編者:王秀友//丁小娜//劉運|責編:李召
  • 出版社:人民郵電
  • ISBN:9787115530080
  • 出版日期:2021/02/01
  • 裝幀:平裝
  • 頁數:262
人民幣:RMB 59.8 元      售價:
放入購物車
加入收藏夾

內容大鋼
    本書系統全面地介紹了有關Hadoop的各類知識。全書共分11章,內容包括緒論、Linux操作系統的安裝、Hadoop的偽分散式安裝、Hadoop集群的搭建及配置、Hadoop HDFS命令、MapReduce編程入門、Hive、Sqoop、HBase、Spark的介紹與安裝、綜合案例——網路爬蟲大數據分析。全書每章內容都與實例緊密結合,有助於學生理解知識、應用知識,達到學以致用的目的。
    本書各章都配備了視頻課程,並且在人郵學院(www.rymooc.com)平台上提供了相應的慕課課程。此外,本書還提供了所有實例的源代碼、製作精良的電子課件、重點及難點教學視頻、在線測試題(包括選擇題、填空題題庫及自測試卷等內容)。其中,源代碼全部經過精心測試,能夠在Ubuntu系統上編譯和運行。
    本書可作為應用型本科院校電腦專業和軟體工程專業、高職院校軟體專業及相關專業的教材,同時也適合Hadoop愛好者、初級的大數據開發人員參考使用。

作者介紹
編者:王秀友//丁小娜//劉運|責編:李召

目錄
第1章  緒論
  1.1  認識大數據
    1.1.1  大數據的定義
    1.1.2  大數據的特點
    1.1.3  大數據行業應用
    1.1.4  Hadoop與大數據
    1.1.5  其他大數據處理平台
    1.1.6  大數據人才
  1.2  什麼是Hadoop
    1.2.1  Hadoop簡介
    1.2.2  Hadoop的發展歷史
    1.2.3  Hadoop的特點
  1.3  Hadoop核心
    1.3.1  分散式文件系統——HDFS
    1.3.2  分散式計算框架——MapReduce
  1.4  Hadoop常用組件
  1.5  Hadoop在國內外的應用情況
  小結
  習題
第2章  Linux操作系統的安裝
  2.1  VirtualBox虛擬機的安裝
    2.1.1  VirtualBox的下載和安裝
    2.1.2  設置VirtualBox存儲文件夾
    2.1.3  在VirtualBox中創建虛擬機
  2.2  Linux操作系統簡介
    2.2.1  概述
    2.2.2  特點
    2.2.3  Linux操作系統的組成
    2.2.4  Linux基本命令
    2.2.5  Linux操作系統的版本
  2.3  Linux操作系統(Ubuntu)的安裝
    2.3.1  Linux操作系統(Ubuntu)的下載
    2.3.2  安裝Ubuntu
    2.3.3  啟動Ubuntu
    2.3.4  設置終端
    2.3.5  設置共享剪貼板
    2.3.6  設置共享文件夾
  小結
  習題
第3章  Hadoop的偽分散式安裝
  3.1  JDK的檢查與安裝
    3.1.1  檢查是否安裝JDK
    3.1.2  安裝JDK
  3.2  配置SSH無密碼登錄
  3.3  Hadoop的下載與安裝
    3.3.1  Hadoop的安裝模式
    3.3.2  Hadoop的下載
    3.3.3  Hadoop的安裝
    3.3.4  配置Hadoop前準備
  3.4  Hadoop環境配置

    3.4.1  設置Hadoop環境變數
    3.4.2  修改Hadoop配置文件
    3.4.3  創建並格式化文件系統
  3.5  啟動Hadoop
  3.6  查看HDFSWeb頁面
  3.7  查看YARNWeb頁面
  小結
  習題
第4章  Hadoop集群的搭建及配置
  4.1  Hadoop集群中節點角色
  4.2  設置集群前的準備工作
    4.2.1  集群中節點的規劃
    4.2.2  設置網路
  4.3  設置伺服器
    4.3.1  設置Master伺服器
    4.3.2  複製虛擬機
    4.3.3  設置Slave伺服器
    4.3.4  設置Master伺服器到Slave伺服器的SSH無密碼登
    4.3.5  格式化文件系統
  4.4  啟動和關閉Hadoop集群
    4.4.1  啟動和關閉Hadoop集群
    4.4.2  驗證Hadoop集群是否啟動成功
  4.5  查看Hadoop集群的基本信息
    4.5.1  查看集群的HDFS信息
    4.5.2  查看集群的YARN信息
  4.6  在Hadoop集群中運行程序
  小結
  習題
第5章  HadoopHDFS命令
  5.1  HDFS常用命令總覽
  5.2  創建與查看HDFS目錄
    5.2.1  創建HDFS目錄
    5.2.2  查看HDFS目錄
  5.3  本地電腦和HDFS之間的文件複製
    5.3.1  從本地電腦複製文件到HDFS
    5.3.2  將HDFS上的文件複製到本地電腦
  5.4  複製與刪除HDFS文件
  5.5  查看HDFS文件內容
  小結
  習題
第6章  MapReduce編程入門
  6.1  認識MapReduce
    6.1.1  MapReduce的編程思想
    6.1.2  MapReduce的運行環境
  6.2  使用Eclipse創建MapReduce工程
    6.2.1  下載與安裝Eclipse
    6.2.2  配置MapReduce環境
  6.3  第一個MapReduce程序:WordCount
    6.3.1  WordCount的設計思路
    6.3.2  編寫WordCount

    6.3.3  分析WordCount程序
    6.3.4  運行程序
  小結
  習題
第7章  Hive
  7.1  Hive簡介
    7.1.1  什麼是Hive
    7.1.2  為什麼使用Hive
    7.1.3  Hive的體系結構
    7.1.4  Hive與關係型資料庫的區別
  7.2  安裝元資料庫
    7.2.1  下載和安裝MySQL資料庫
    7.2.2  登錄MySQL資料庫
    7.2.3  使用MySQL資料庫
  7.3  安裝與配置Hive
    7.3.1  準備工作
    7.3.2  下載Hive
    7.3.3  安裝Hive
    7.3.4  配置Hive
    7.3.5  啟動並驗證Hive
  7.4  數據類型和存儲格式
    7.4.1  基本數據類型
    7.4.2  複雜數據類型
    7.4.3  存儲格式
    7.4.4  數據格式
  7.5  Hive中的數據定義
    7.5.1  操作資料庫
    7.5.2  查看與創建數據表
    7.5.3  Hive中其他的數據表
    7.5.4  修改數據表
    7.5.5  刪除數據表
  7.6  Hive中的數據操作
    7.6.1  載入數據
    7.6.2  插入數據
    7.6.3  導出數據
  小結
  習題
第8章  Sqoop
  8.1  安裝並配置Sqoop
    8.1.1  下載並安裝Sqoop
    8.1.2  配置Sqoop
    8.1.3  驗證Sqoop
    8.1.4  測試Sqoop與MySQL的連接
  8.2  Sqoop命令
  8.3  Sqoop導入
    8.3.1  使用Sqoop把MySQL數據導入HDFS
    8.3.2  使用Sqoop把MySQL數據導入Hive
    8.3.3  有選擇地導入數據
  8.4  Sqoop導出
    8.4.1  使用Sqoop將Hadoop數據導出到MySQL

    8.4.2  使用Sqoop將Hive數據導出到MySQL
  小結
  習題
第9章  HBase
  9.1  ZooKeeper集群的安裝與配置
    9.1.1  ZooKeeper簡介
    9.1.2  ZooKeeper安裝
    9.1.3  配置ZooKeeper集群
    9.1.4  啟動ZooKeeper集群
  9.2  HBase集群的安裝與配置
    9.2.1  下載並安裝HBase
    9.2.2  配置HBase
    9.2.3  啟動並驗證HBase
  9.3  HBase的基本應用
    9.3.1  創建表
    9.3.2  插入數據
    9.3.3  掃描全表的數據
    9.3.4  獲取某一行的數據
    9.3.5  刪除表
  小結
  習題
第10章  Spark的介紹與安裝
  10.1  Spark概述
    10.1.1  Spark系統架構
    10.1.2  Spark運行流程
  10.2  安裝與配置Scala
    10.2.1  下載Scala
    10.2.2  安裝Scala
    10.2.3  啟動與應用Scala
  10.3  安裝與配置Spark
    10.3.1  安裝模式
    10.3.2  安裝Spark
    10.3.3  配置環境變數
    10.3.4  啟動並驗證Spark
  10.4  運行Spark程序
  小結
  習題
第11章  綜合案例——網路爬蟲大數據分析
  11.1  網路爬蟲概述
    11.1.1  網路爬蟲
    11.1.2  網路爬蟲——快手爬票
    11.1.3  開發語言選擇
  11.2  搭建Python開發環境
    11.2.1  開發環境概述
    11.2.2  安裝Python
  11.3  搭建Qt環境
    11.3.1  安裝Qt
    11.3.2  安裝PyCharm開發工具
  11.4  主窗體設計
    11.4.1  Qt拖曳控制項

    11.4.2  代碼調試細節
  11.5  分析網頁請求參數
  11.6  下載站名文件
  11.7  車票信息的請求與顯示
    11.7.1  發送與分析車票信息的查詢請求
    11.7.2  主窗體中顯示查票信息
  11.8  Hadoop中的網路爬蟲
  小結
  習題

  • 商品搜索:
  • | 高級搜索
首頁新手上路客服中心關於我們聯絡我們Top↑
Copyrightc 1999~2008 美商天龍國際圖書股份有限公司 臺灣分公司. All rights reserved.
營業地址:臺北市中正區重慶南路一段103號1F 105號1F-2F
讀者服務部電話:02-2381-2033 02-2381-1863 時間:週一-週五 10:00-17:00
 服務信箱:bookuu@69book.com 客戶、意見信箱:cs@69book.com
ICP證:浙B2-20060032