幫助中心 | 我的帳號 | 關於我們

Spark大數據技術項目實戰(新一代信息技術系列教材)

  • 作者:編者:鄧永生//李麗//張俊豪|責編:高櫻
  • 出版社:西安電子科大
  • ISBN:9787560676029
  • 出版日期:2025/02/01
  • 裝幀:平裝
  • 頁數:209
人民幣:RMB 49 元      售價:
放入購物車
加入收藏夾

內容大鋼
    本書主要圍繞大數據處理技術Spark展開講解,旨在引導讀者深入了解大數據分析處理的全流程,並剖析每個環節中所使用的關鍵技術及其原理。
    全書共八個實戰項目。項目一介紹了如何搭建一個穩定且高效的Spark集群環境,探討了Spark的基本概念、特點及應用場景,同時與Hadoop進行了對比分析。項目二通過實現一個完整的人事管理系統,介紹了Scala語言的基礎語法與面向對象編程及函數式編程的概念,示範了如何使用Scala進行Spark應用開發。項目三至項目七運用Spark分別對電商用戶行為數據、電影數據、銀行客戶數據、設備故障數據以及社交媒體評論數據進行了數據分析與處理,內容涵蓋從數據預處理到高級統計分析的全過程。項目八通過一個綜合性的案例——基於Spark MLlib的廣告點擊率預測,將前面所學的知識融會貫通,逐步帶領讀者完成大數據開發的核心流程,包括數據預處理、特徵工程、模型訓練與評估等步驟。本書不僅提供了豐富的理論知識,還輔以大量實戰案例,旨在幫助讀者全面掌握Spark大數據技術的實際應用。
    本書可作為高等院校電腦相關專業的教材,也可作為電腦領域技術人員及編程愛好者的參考書。

作者介紹
編者:鄧永生//李麗//張俊豪|責編:高櫻

目錄
項目一  搭建Spark集群環境
  任務1.1  認識Spark
    1.1.1  Spark概述
    1.1.2  Spark的特點
    1.1.3  Spark的應用場景
    1.1.4  Spark和Hadoop對比
  任務1.2  搭建Spark集群
    1.2.1  安裝準備
    1.2.2  Spark的部署方式
    1.2.3  Spark集群的安裝與部署
  任務1.3  Spark運行架構與原理
    1.3.1  Spark集群的運行架構
    1.3.2  Spark運行的基本原理
  創新學習
  能力測試
項目二  使用Scala實現人事管理系統
  任務2.1  搭建Scala開發環境
    2.1.1  Scala簡介
    2.1.2  搭建Scala開發環境
    2.1.3  Scala代碼的運行方式
  任務2.2  學習Scala基礎語法
    2.2.1  基本語法和結構
    2.2.2  數據類型和操作
    2.2.3  面向對象編程
    2.2.4  函數式編程
    2.2.5  輸入輸出和異常處理
    2.2.6  高級特性
  任務2.3  實現人事管理系統
    2.3.1  人事管理系統需求介紹
    2.3.2  系統架構與技術設計
    2.3.3  需求功能實現
    2.3.4  編譯與運行
    2.3.5  代碼優化
  創新學習
  能力測試
項目三  電商用戶行為數據分析
  任務3.1  認識RDD
    3.1.1  RDD的概念
    3.1.2  RDD的特點
    3.1.3  RDD操作的分類
  任務3.2  RDD操作實踐
    3.2.1  Spark Shell環境實操
    3.2.2  創建RDD的方式
    3.2.3  常用轉換操作實踐
    3.2.4  常用行動操作實踐
  任務3.3  使用RDD實現電商用戶行為分析
    3.3.1  電商用戶行為數據簡介
    3.3.2  功能需求分析
    3.3.3  需求實現思路分析
    3.3.4  數據預處理

    3.3.5  需求功能實現
  創新學習
  能力測試
項目四  電影數據分析實現
  任務4.1  搭建Spark開發環境
    4.1.1  IntelliJ IDEA介紹和安裝
    4.1.2  Zeppelin的安裝和基本使用
  任務4.2  編寫第一個Spark程序
    4.2.1  編程模型介紹
    4.2.2  Spark WordCount案例分析
    4.2.3  Spark WordCount代碼實現
  任務4.3  打包並運行Spark程序
    4.3.1  打包插件介紹
    4.3.2  打包程序實操
    4.3.3  提交Spark程序到集群運行
  任務4.4  編程實現電影數據分析
    4.4.1  項目背景
    4.4.2  數據描述
    4.4.3  功能需求
    4.4.4  需求實現
  創新學習
  能力測試
項目五  銀行客戶數據分析
  任務5.1  認識Spark SQL
    5.1.1  Spark SQL概述
    5.1.2  數據表示與處理
    5.1.3  SQL查詢與優化
  任務5.2  Spark SQL基礎
    5.2.1  DataFrame API基礎操作
    5.2.2  數據源和格式
  任務5.3  Spark SQL進階操作
    5.3.1  高級操作與功能
    5.3.2  性能優化與調優
    5.3.3  擴展與整合
  任務5.4  分析與統計銀行客戶數據
    5.4.1  銀行客戶數據簡介
    5.4.2  數據預處理和準備
    5.4.3  數據探索與分析
    5.4.4  客戶行為分析
  創新學習
  能力測試
項目六  設備故障的實時監控
  任務6.1  認識Structured Streaming
    6.1.1  結構化流處理概述
    6.1.2  數據源和數據接收器
    6.1.3  實時數據處理和輸出
  任務6.2  模擬生成設備數據
    6.2.1  設備數據生成工具
    6.2.2  設備數據流處理
  任務6.3  實現設備故障的實時監控

    6.3.1  設備故障監控系統架構
    6.3.2  設備故障實時監控處理
  創新學習
  能力測試
項目七  社交媒體評論情感分析
  任務7.1  了解Spark MLlib
    7.1.1  Spark MLlib概述
    7.1.2  機器學習工作流程
    7.1.3  房產數據處理與輸出
  任務7.2  數據處理與模型應用
    7.2.1  數據收集與準備
    7.2.2  特徵工程與模型訓練
    7.2.3  模型評估與部署
  任務7.3  對社交媒體評論數據進行情感分析
    7.3.1  社交媒體評論數據概述
    7.3.2  數據收集與預處理
    7.3.3  情感分析模型訓練與評估
    7.3.4  情感分析結果展示
  創新學習
  能力測試
項目八  基於Spark MLlib的廣告點擊率預測
  任務8.1  項目介紹
    8.1.1  項目背景
    8.1.2  項目任務
    8.1.3  項目實施流程
  任務8.2  準備數據集
  任務8.3  數據預處理
  任務8.4  特徵工程實現
  任務8.5  模型訓練與預測
  任務8.6  模型評估與優化
  創新學習
  能力測試
參考文獻

  • 商品搜索:
  • | 高級搜索
首頁新手上路客服中心關於我們聯絡我們Top↑
Copyrightc 1999~2008 美商天龍國際圖書股份有限公司 臺灣分公司. All rights reserved.
營業地址:臺北市中正區重慶南路一段103號1F 105號1F-2F
讀者服務部電話:02-2381-2033 02-2381-1863 時間:週一-週五 10:00-17:00
 服務信箱:bookuu@69book.com 客戶、意見信箱:cs@69book.com
ICP證:浙B2-20060032