幫助中心 | 我的帳號 | 關於我們

大數據技術基礎及應用教程(Linux+Hadoop+Spark面向新工科高等院校大數據專業系列教材)

  • 作者:編者:井超//樊永生|責編:王斌//解芳
  • 出版社:機械工業
  • ISBN:9787111710912
  • 出版日期:2022/07/01
  • 裝幀:平裝
  • 頁數:228
人民幣:RMB 59.9 元      售價:
放入購物車
加入收藏夾

內容大鋼
    本書從大數據技術相關概念出發,系統介紹了構建大數據平台的相關技術,並在此基礎上進行離線數據分析和在線數據分析。全書共三篇,分為7章,內容包括技術基礎篇、分散式集群篇、平台構建篇,第一篇包括大數據技術概述、大數據分析技術,第二篇包括Linux技術基礎、Hadoop技術基礎及構建Hadoop集群、Spark技術基礎及構建Spark集群,第三篇包括構建基於Spark的實時交易數據統計平台、構建基於Hadoop的離線電商大數據分析平台。
    本書以理論為基礎,以實例為引導,完整闡述了如何從無到有搭建大數據平台,並在此平台基礎上進行應用。本書配套資源豐富,包括教學PPT、所有程序的源代碼、相關集群虛擬機、擴展學習視頻、課後練習題及答案,可方便授課教師教學及學生自學。
    本書可作為高校數據科學與大數據技術等相關專業的教材,也可作為對大數據技術感興趣的相關人員的參考用書。
    本書配有授課教學資源,需要的教師可登錄www.cmpedu.com免費註冊,審核通過後下載,或聯繫編輯索取(微信:15910938545,電話:010-88379739)。

作者介紹
編者:井超//樊永生|責編:王斌//解芳

目錄
前言
第一篇  技術基礎篇
  第1章  大數據技術概述
    1.1  大數據的基本概念
      1.1.1  大數據的產生階段
      1.1.2  大數據的特徵
      1.1.3  大數據在各個領域的應用
      1.1.4  大數據的核心技術和計算模式
    1.2  分散式技術與集群
      1.2.1  分散式技術概述
      1.2.2  分散式大數據集群概述
    1.3  大數據技術生態圈
      1.3.1  Linux操作系統
      1.3.2  Hadoop生態系統
      1.3.3  Spark對Hadoop的完善
    本章小結
    本章練習
  第2章  大數據分析技術
    2.1  大數據分析流程及相關技術
      2.1.1  數據採集與預處理
      2.1.2  大數據存儲
      2.1.3  大數據分析與挖掘
      2.1.4  數據可視化
    2.2  大數據分析常用方法
      2.2.1  數理統計分析
      2.2.2  聚類分析
      2.2.3  分類分析
      2.2.4  回歸分析
    2.3  數據分析基礎工具
      2.3.1  數據採集工具——Selenium和PhantomJS
      2.3.2  數據清洗工具——Kettle
      2.3.3  數據存儲工具——MongoDB和MySQL
      2.3.4  機器學習工具——Scikit-learn
      2.3.5  數據可視化工具——Matplotlib、PyEcharts、Superset
    本章小結
    本章練習
第二篇  分散式集群篇
  第3章  Linux技術基礎
    3.1  用戶與組管理
      3.1.1  用戶管理相關命令
      3.1.2  組管理相關命令
      3.1.3  其他命令
    3.2  文件與目錄管理
      3.2.1  常用文件操作命令
      3.2.2  目錄操作命令
      3.2.3  改變文件或目錄訪問許可權
      3.2.4  文件備份和壓縮
    3.3  進程管理與作業控制
      3.3.1  進程查看
      3.3.2  進程調度

    3.4  磁碟存儲管理
      3.4.1  磁碟管理命令
      3.4.2  存取命令
    3.5  系統管理與常用網路命令
      3.5.1  系統管理
      3.5.2  常用網路命令
    3.6  在線幫助系統
    3.7  實踐:Linux操作系統的安裝與部署
      3.7.1  Linux的安裝和卸載
      3.7.2  區域網主機間遠程複製文件
      3.7.3  XML文件介紹
      3.7.4  VMware安裝及CentOS系統環境準備
      3.7.5  克隆虛擬機
      3.7.6  配置主機名
      3.7.7  配置網路IP地址
    本章小結
    本章練習
  第4章  Hadoop技術基礎及構建Hadoop集群
    4.1  Hadoop技術基礎
      4.1.1  Hadoop的組成
      4.1.2  Hadoop的運行模式
      4.1.3  HDFS文件的存取
      4.1.4  Hadoop集群的環境配置
      4.1.5  Hadoop集群的搭建
      4.1.6  啟動Hadoop集群
    4.2  ZooKeeper技術基礎及部署
      4.2.1  ZooKeeper簡介
      4.2.2  ZooKeeper的安裝部署
      4.2.3  Leader選舉機制
      4.2.4  ZooKeeper客戶端訪問集群(命令行操作方式)
    4.3  HDFS與YARN高可用技術基礎
      4.3.1  HDFS高可用的工作機制
      4.3.2  HDFS高可用配置
      4.3.3  YARN高可用的工作機制
      4.3.4  YARN高可用配置
    4.4  實踐:HDFS及MapReduce的應用示例
      4.4.1  讀寫HDFS文件
      4.4.2  MapReduce操作1:二次排序
      4.4.3  MapReduce操作2:計數器
      4.4.4  MapReduce操作3:Join操作
    本章小結
    本章練習
  第5章  Spark技術基礎及構建Spark集群
    5.1  Spark核心機制
      5.1.1  Spark基本原理
      5.1.2  Spark系統架構
      5.1.3  SparkShell操作
    5.2  Hive原理及實踐
      5.2.1  Hive定義
      5.2.2  Hive架構

      5.2.3  Hive表分類及查詢操作
    5.3  HBase原理及實踐
      5.3.1  HBase定義
      5.3.2  HBase集群架構
      5.3.3  HBase數據模型
    5.4  Kafka原理及實踐
      5.4.1  Kafka定義
      5.4.2  Kafka消息隊列
      5.4.3  Kafka基礎架構
    5.5  Flume原理及實踐
      5.5.1  Flume簡介
      5.5.2  Flume基礎架構
    5.6  實踐:搭建基於Spark的實時大數據平台
      5.6.1  Spark安裝部署
      5.6.2  MySQL安裝部署
      5.6.3  Hive安裝部署
      5.6.4  HBase安裝部署
      5.6.5  Kafka安裝部署
      5.6.6  Flume安裝部署
      5.6.7  Spark集群典型應用
    本章小結
    本章練習
第三篇  平台構建篇
  第6章  構建基於Spark的實時交易數據統計平台
    6.1  系統需求與架構
      6.1.1  系統背景介紹
      6.1.2  系統功能需求
      6.1.3  系統架構設計
    6.2  Redis簡介
      6.2.1  Redis資料庫的作用
      6.2.2  Redis部署與啟動
      6.2.3  Redis常用命令
    6.3  系統開發流程
    6.4  數據獲取模塊實現
      6.4.1  模擬訂單數據
      6.4.2  向Kafka集群發送訂單數據
    6.5  數據分析與處理模塊實現
      6.5.1  分析訂單數據
      6.5.2  生成結果
    6.6  數據可視化模塊實現
      6.6.1  搭建Web開發環境
      6.6.2  實現數據展示功能
      6.6.3  可視化平台展示
    本章小結
    本章練習
  第7章  構建基於Hadoop的離線電商大數據分析平台
    7.1  系統需求與架構
      7.1.1  系統背景介紹
      7.1.2  系統功能需求
      7.1.3  系統架構設計

    7.2  數據採集模塊實現
      7.2.1  商品信息爬取
      7.2.2  調試分析
    7.3  數據處理與存儲模塊實現
      7.3.1  信息分析與處理
      7.3.2  商品信息存儲
      7.3.3  調試分析
    7.4  數據可視化模塊實現
      7.4.1  使用Superset連接MySQL資料庫
      7.4.2  調試分析
    本章小結
    本章練習
參考文獻

  • 商品搜索:
  • | 高級搜索
首頁新手上路客服中心關於我們聯絡我們Top↑
Copyrightc 1999~2008 美商天龍國際圖書股份有限公司 臺灣分公司. All rights reserved.
營業地址:臺北市中正區重慶南路一段103號1F 105號1F-2F
讀者服務部電話:02-2381-2033 02-2381-1863 時間:週一-週五 10:00-17:00
 服務信箱:bookuu@69book.com 客戶、意見信箱:cs@69book.com
ICP證:浙B2-20060032