幫助中心 | 我的帳號 | 關於我們

Spark項目實訓(Python版)/大數據技術與應用叢書

  • 作者:編者:黑馬程序員|責編:袁勤勇//楊楓
  • 出版社:清華大學
  • ISBN:9787302685302
  • 出版日期:2025/03/01
  • 裝幀:平裝
  • 頁數:184
人民幣:RMB 39 元      售價:
放入購物車
加入收藏夾

內容大鋼
    本書以電商網站中的用戶行為數據作為數據源,系統介紹了使用Spark生態系統進行離線分析和實時分析的方法。全書共6章,分別講解了項目概述、搭建集群環境、使用Flume實現數據採集、使用Hive構建數據倉庫、使用Spark進行數據分析以及使用FineBI實現數據可視化。
    本書適合作為高等學校數據科學與大數據技術及相關專業的教材,也適合數據分析、數據可視化等領域的從業者閱讀。

作者介紹
編者:黑馬程序員|責編:袁勤勇//楊楓

目錄
第1章  項目概述
  1.1  項目需求和目標
  1.2  預備知識
  1.3  項目架構
  1.4  開發環境和工具
  1.5  項目開發流程
  1.6  本章小結
第2章  搭建集群環境
  2.1  基礎環境搭建
    2.1.1  創建虛擬機
    2.1.2  安裝Linux操作系統
    2.1.3  克隆虛擬機
    2.1.4  配置虛擬機
  2.2  安裝JDK
  2.3  部署Hadoop集群
  2.4  部署Hive
  2.5  部署Flume
  2.6  部署ZooKeeper集群
  2.7  部署Kafka集群
  2.8  部署Spark
  2.9  部署Doris集群
  2.10  本章小結
第3章  數據採集
  3.1  用戶行為數據概述
  3.2  模擬生成用戶行為數據
    3.2.1  生成歷史用戶行為數據
    3.2.2  生成實時用戶行為數據
  3.3  配置採集方案
  3.4  採集用戶行為數據
  3.5  本章小結
第4章  數據倉庫
  4.1  數據倉庫設計
  4.2  構建數據倉庫
  4.3  向數據倉庫載入數據
    4.3.1  向ODS層的表載入數據
    4.3.2  向DWD層的表載入數據
  4.4  本章小結
第5章  數據分析
  5.1  流量分析
  5.2  商品分析
  5.3  設備分析
  5.4  推薦系統
  5.5  地域分析
  5.6  本章小結
第6章  數據可視化
  6.1  Doris集成Hive
  6.2  FineBI的安裝與配置
  6.3  實現數據可視化
    6.3.1  新建數據集
    6.3.2  實現流量分析的可視化

    6.3.3  實現商品分析的可視化
    6.3.4  實現設備分析的可視化
    6.3.5  實現地域分析的可視化
  6.4  本章小結

  • 商品搜索:
  • | 高級搜索
首頁新手上路客服中心關於我們聯絡我們Top↑
Copyrightc 1999~2008 美商天龍國際圖書股份有限公司 臺灣分公司. All rights reserved.
營業地址:臺北市中正區重慶南路一段103號1F 105號1F-2F
讀者服務部電話:02-2381-2033 02-2381-1863 時間:週一-週五 10:00-17:00
 服務信箱:bookuu@69book.com 客戶、意見信箱:cs@69book.com
ICP證:浙B2-20060032