幫助中心 | 我的帳號 | 關於我們

Hadoop大數據技術原理與編程(數據科學與大數據技術微課版面向新工科專業建設電腦系列教材)

  • 作者:曹潔//齊平//陳明//王福成|責編:白立軍//薛陽|總主編:張堯學
  • 出版社:清華大學
  • ISBN:9787302666790
  • 出版日期:2024/07/01
  • 裝幀:平裝
  • 頁數:292
人民幣:RMB 69 元      售價:
放入購物車
加入收藏夾

內容大鋼
    本書系統介紹了大數據的相關知識,全書共13章,內容包括Hadoop大數據處理架構、HDFS分散式文件系統、YARN資源管理、MapReduce分散式計算框架、HBase分散式資料庫、流數據採集、典型非關係資料庫的安裝與使用、分散式數據分析工具Pig、Spark大數據處理框架、基於Python的Spark RDD編程、基於Python的Spark SQL結構化數據處理、Hive分散式數據倉庫、典型數據可視化工具的使用。本書對大數據相關技術給出詳細的編程示例,並給出詳細的註解。
    本書可作為高等院校電腦、信息管理、軟體工程、人工智慧、數據科學與大數據技術等相關專業的大數據課程教材,也可供相關技術人員參考。

作者介紹
曹潔//齊平//陳明//王福成|責編:白立軍//薛陽|總主編:張堯學

目錄
第1章  Hadoop大數據處理架構
  1.1  大數據的基本概念
    1.1.1  大數據時代
    1.1.2  大數據定義
    1.1.3  大數據的特徵
    1.1.4  大數據思維
  1.2  大數據計算模式與典型系統
    1.2.1  批處理計算模式與典型系統
    1.2.2  流式計算模式與典型系統
    1.2.3  迭代計算模式與典型系統
    1.2.4  圖計算模式與典型系統
    1.2.5  內存計算模式與典型系統
  1.3  Hadoop發展歷程
  1.4  Hadoop優缺點
  1.5  Hadoop生態圈
  1.6  在VirtualBox上搭建Linux操作系統
    1.6.1  創建Master節點
    1.6.2  克隆虛擬電腦
  1.7  Hadoop安裝前的準備工作
    1.7.1  創建hadoop用戶
    1.7.2  安裝SSH、配置SSH無密碼登錄
    1.7.3  安裝Java環境
    1.7.4  Linux操作系統下Scala版本的Eclipse的安裝與配置
    1.7.5  Eclipse環境下Java語言程序開發實例
  1.8  Hadoop的安裝與配置
    1.8.1  下載Hadoop安裝文件
    1.8.2  Hadoop單機模式配置
    1.8.3  Hadoop偽分散式模式配置
    1.8.4  Hadoop分散式模式配置
  1.9  習題
第2章  HDFS分散式文件系統
  2.1  HDFS基本特徵
  2.2  HDFS存儲架構及組件功能
    2.2.1  HDFS存儲架構
    2.2.2  數據塊
    2.2.3  數據節點
    2.2.4  名稱節點
    2.2.5  第二名稱節點
    2.2.6  心跳消息
    2.2.7  客戶端
  2.3  HDFS讀寫文件流程
    2.3.1  HDFS讀文件流程
    2.3.2  HDFS寫文件流程
  2.4  HDFS的Shell操作
    2.4.1  查看命令使用方法
    2.4.2  HDFS常用的Shell操作
    2.4.3  HDFS管理員命令
    2.4.4  HDFS的Java API操作
  2.5  案例實戰1:修改文件名
    2.5.1  在Eclipse中創建項目

    2.5.2  為項目添加需要用到的JAR包
    2.5.3  編寫Java語言應用程序
    2.5.4  編譯運行程序
    2.5.5  應用程序的部署
  2.6  案例實戰2:文件讀取、上傳和下載
    2.6.1  讀取文件內容
    2.6.2  文件上傳和下載
  2.7  習題
第3章  YARN資源管理
  3.1  YARN概述
  3.2  YARN基礎架構
    3.2.1  Container
    3.2.2  ResourceManager
    3.2.3  NodeManager
    3.2.4  Applleation Master
    3.2.5  Client
  ……
第4章  MapReduce分散式計算框架
第5章  HBase分散式資料庫
第6章  流數據採集
第7章  典型非關係資料庫的安裝與使用
第8章  分散式數據分析工具Pig
第9章  Spark大數據處理框架
第10章  基於Python語言的Spark RDD編程
第11章  基於Python語言的Spark SQL結構化數據處理
第12章  Hive分散式數據倉庫
第13章  典型數據可視化工具的使用
參考文獻

  • 商品搜索:
  • | 高級搜索
首頁新手上路客服中心關於我們聯絡我們Top↑
Copyrightc 1999~2008 美商天龍國際圖書股份有限公司 臺灣分公司. All rights reserved.
營業地址:臺北市中正區重慶南路一段103號1F 105號1F-2F
讀者服務部電話:02-2381-2033 02-2381-1863 時間:週一-週五 10:00-17:00
 服務信箱:bookuu@69book.com 客戶、意見信箱:cs@69book.com
ICP證:浙B2-20060032