幫助中心 | 我的帳號 | 關於我們

Spark項目實戰/大數據技術與應用叢書

  • 作者:編者:黑馬程序員|責編:袁勤勇//楊楓
  • 出版社:清華大學
  • ISBN:9787302581475
  • 出版日期:2021/07/01
  • 裝幀:平裝
  • 頁數:174
人民幣:RMB 48 元      售價:
放入購物車
加入收藏夾

內容大鋼
    本書運用Spark計算框架的核心組件對電商數據進行分析,以項目形式呈現,其內容涵蓋環境搭建、數據分析、數據持久化和數據可視化,涉及JavaEE、ECharts、Hadoop、HBase、Spark、Kafka和ZooKeeper等技術點的綜合應用。針對項目開發過程的每個環節都進行了深入講解,使讀者由淺入深地了解每個環節的知識內容。
    本書共分為7章。第1章主要介紹項目開發的基本情況;第2章主要介紹大數據集群環境的搭建;第3章主要介紹通過Spark實現熱門品類Top10分析,並對分析結果進行持久化操作;第4章主要介紹通過Spark實現各區域熱門商品Top3分析,並對分析結果進行持久化操作;第5章主要介紹通過Spark SQL實現網站轉化率統計,並對分析結果進行持久化操作;第6章主要介紹通過Spark Streaming實現廣告點擊流實時統計,並實時持久化統計結果;第7章主要介紹通過可視化技術將第3?6章的分析與統計結果進行圖形化展示。
    本書配有視頻、源代碼、教學設計、教學PPT、教學大綱等資源。同時,為了幫助初學者更好地學習書中的內容,還提供了在線答疑,歡迎讀者關注。
    本書適合擁有Spark基礎的讀者閱讀,也可以作為高等院校相關課程的教學參考書。讀者不僅能夠通過項目實戰鞏固基礎知識的學習效果,還能學習商業智能系統的開發過程。

作者介紹
編者:黑馬程序員|責編:袁勤勇//楊楓

目錄
第1章  項目概述
  1.1  項目需求和目標
  1.2  預備知識
  1.3  項目架構設計及技術選取
  1.4  開發環境和開發工具介紹
  1.5  項目開發流程
  1.6  硬體要求
  1.7  本章小結
第2章  搭建大數據集群環境
  2.1  安裝準備
    2.1.1  認識Linux操作系統
    2.1.2  創建虛擬機
    2.1.3  啟動虛擬機並安裝Linux操作系統
    2.1.4  克隆虛擬機
    2.1.5  配置Linux操作系統網路及主機名
    2.1.6  SSH配置
    2.1.7  配置時間同步
  2.2  安裝JDK
  2.3  ZooKeeper集群部署
    2.3.1  ZooKeeper集群的安裝與配置
    2.3.2  ZooKeeper集群的啟動與關閉
  2.4  Hadoop集群部署
    2.4.1  Hadoop高可用集群規劃
    2.4.2  安裝Hadoop
    2.4.3  Hadoop高可用集群配置
    2.4.4  啟動Hadoop高可用集群
  2.5  Spark集群部署
    2.5.1  Spark集群部署模式
    2.5.2  Spark集群安裝配置
    2.5.3  Spark集群測試
  2.6  HBase集群部署
    2.6.1  HBase集群規劃
    2.6.2  HBase集群安裝配置
    2.6.3  啟動HBase集群
  2.7  Kafka集群部署
    2.7.1  Kafka集群的安裝與配置
    2.7.2  啟動Kafka集群
  2.8  本章小結
第3章  熱門品類Top10分析
  3.1  數據集分析
  3.2  實現思路分析
  3.3  實現熱門品類Top
    3.3.1  創建項目
    3.3.2  創建Spark連接並讀取數據集
    3.3.3  獲取業務數據
    3.3.4  統計品類的行為類型
    3.3.5  過濾品類的行為類型
    3.3.6  合併相同品類的行為類型
    3.3.7  根據品類的行為類型進行排序
    3.3.8  數據持久化

  3.4  運行程序
  3.5  本章小結
第4章  各區域熱門商品Top3分析
  4.1  實現思路分析
  4.2  實現各區域熱門商品Top
    4.2.1  創建Spark連接並讀取數據集
    4.2.2  獲取業務數據
    4.2.3  過濾商品的行為類型
    4.2.4  轉換數據格式
    4.2.5  統計每個區域中的不同商品
    4.2.6  根據區域進行分組
    4.2.7  根據區域內商品的查看次數進行排序
    4.2.8  數據持久化
  4.3  運行程序
  4.4  本章小結
第5章  網站轉化率統計
  5.1  數據集分析
  5.2  實現思路分析
  5.3  實現網站轉化率統計
    5.3.1  生成用戶瀏覽網頁數據
    5.3.2  修改pom.xml文件
    5.3.3  創建Spark連接並讀取數據集
    5.3.4  統計每個頁面訪問次數
    5.3.5  獲取每個用戶瀏覽網頁的順序
    5.3.6  合併同一用戶瀏覽的網頁
    5.3.7  統計每個單跳的次數
    5.3.8  計算頁面單跳轉化率
    5.3.9  數據持久化
  5.4  運行程序
  5.5  本章小結
第6章  廣告點擊流實時統計
  6.1  數據集分析
  6.2  實現思路分析
  6.3  資料庫設計
  6.4  實現廣告點擊流實時統計
    6.4.1  修改pom.xml文件
    6.4.2  生產用戶廣告點擊流數據
    6.4.3  創建Spark Streaming連接
    6.4.4  讀取用戶廣告點擊流數據
    6.4.5  獲取業務數據
    6.4.6  讀取黑名單用戶數據
    6.4.7  過濾黑名單用戶
    6.4.8  統計每個城市不同廣告的點擊次數
    6.4.9  添加黑名單用戶
    6.4.10  數據持久化
  6.5  運行程序
  6.6  本章小結
第7章  數據可視化
  7.1  系統概述
    7.1.1  技術選取

    7.1.2  系統架構
  7.2  數據表設計與實現
    7.2.1  數據表介紹
    7.2.2  Phoenix集成HBase
    7.2.3  建立Phoenix與HBase表映射
  7.3  創建Spring Boot項目
  7.4  實現熱門品類Top10數據可視化
    7.4.1  創建實體類Top10Entity
    7.4.2  創建資料庫訪問介面Top10Dao
    7.4.3  創建控制器類Top10Controller
    7.4.4  創建HTML文件top10.html
    7.4.5  運行項目實現熱門品類Top10數據可視化
  7.5  實現各區域熱門商品Top3數據可視化
    7.5.1  創建實體類Top3Entity
    7.5.2  創建資料庫訪問介面Top3Dao
    7.5.3  創建控制器類Top3Controller
    7.5.4  創建HTML文件top3.html
    7.5.5  運行項目實現各區域熱門商品Top3數據可視化
  7.6  實現頁面單跳轉化率數據可視化
    7.6.1  創建實體類ConversionEntity
    7.6.2  創建資料庫訪問介面ConversionDao
    7.6.3  創建控制器類ConversionController
    7.6.4  創建HTML文件conversion.html
    7.6.5  運行項目實現頁面單跳轉化率數據可視化
  7.7  實現廣告點擊流實時統計可視化
    7.7.1  創建實體類AdsEntity
    7.7.2  創建資料庫訪問介面AdsDao
    7.7.3  創建控制器類AdsController
    7.7.4  創建HTML文件ads.html
    7.7.5  運行項目實現廣告點擊流實時統計可視化
  7.8  本章小結

  • 商品搜索:
  • | 高級搜索
首頁新手上路客服中心關於我們聯絡我們Top↑
Copyrightc 1999~2008 美商天龍國際圖書股份有限公司 臺灣分公司. All rights reserved.
營業地址:臺北市中正區重慶南路一段103號1F 105號1F-2F
讀者服務部電話:02-2381-2033 02-2381-1863 時間:週一-週五 10:00-17:00
 服務信箱:bookuu@69book.com 客戶、意見信箱:cs@69book.com
ICP證:浙B2-20060032