幫助中心 | 我的帳號 | 關於我們

Spark大數據分析與實戰/大數據技術與應用叢書

  • 作者:編者:黑馬程序員
  • 出版社:清華大學
  • ISBN:9787302534327
  • 出版日期:2019/09/01
  • 裝幀:平裝
  • 頁數:228
人民幣:RMB 49 元      售價:
放入購物車
加入收藏夾

內容大鋼
    本書從初學者角度詳細介紹了Spark應用程序體系架構的核心技術,全書共9章。第1章詳細介紹開發Spark框架的Scala編程語言;第2?4、7?8章主要講解Spark核心基礎、SparkRDD彈性分散式數據集、Spark SQL處理結構化數據、Spark Streaming實時計算框架、Spark MLlib機器學習庫,並包含了搭建Spark集群、Spark集群的操作方式、利用Spark解決大數據工作中遇到的基本問題。第5?6章主要講解大數據環境中常見的輔助系統,HBase資料庫以及Kafka流處理平台,包含輔助系統的搭建方式、使用方法以及相關底層實現的基本原理;第9章是一個綜合項目,利用Spark框架開發流式計算系統。掌握Spark相關技術,能夠很好地適應企業開發的技術需要,為離線、實時數據處理平台的開發奠定基礎。
    本書附有配套源代碼、教學PPT、題庫、教學視頻、教學補充案例、教學設計等資源。為了幫助初學者更好地學習本書中的內容,還提供了在線答疑,歡迎讀者關注。
    本書可作為高等院校本、專科電腦相關專業,大數據課程的專用教材,是一本適合廣大電腦編程愛好者的優秀讀物。

作者介紹
編者:黑馬程序員

目錄
第1章  Scala語言基礎
  1.1  初識Scala
    1.1.1  Scala概述
    1.1.2  Scala的下載安裝
    1.1.3  在IDEA開發工具中下載安裝Scala插件
    1.1.4  開發第一個Scala程序
  1.2  Scala的基礎語法
    1.2.1  聲明值和變數
    1.2.2  數據類型
    1.2.3  算術和操作符重載
    1.2.4  控制結構語句
    1.2.5  方法和函數
  1.3  Scala的數據結構
    1.3.1  數組
    1.3.2  元組
    1.3.3  集合
  1.4  Scala面向對象的特性
    1.4.1  類與對象
    1.4.2  繼承
    1.4.3  單例對象和伴生對象
    1.4.4  特質
  1.5  Scala的模式匹配與樣例類
    1.5.1  模式匹配
    1.5.2  樣例類
  1.6  本章小結
  1.7  課後習題
第2章  Spark基礎
  2.1  初識Spark33目錄Spark大數據分析與實戰
    2.1.1  Spark概述
    2.1.2  Spark的特點
    2.1.3  Spark應用場景
    2.1.4  Spark與Hadoop對比
  2.2  搭建Spark開發環境
    2.2.1  環境準備
    2.2.2  Spark的部署方式
    2.2.3  Spark集群安裝部署
    2.2.4  Spark HA集群部署
  2.3  Spark運行架構與原理
    2.3.1  基本概念
    2.3.2  Spark集群運行架構
    2.3.3  Spark運行基本流程
  2.4  體驗第一個Spark程序
  2.5  啟動Spark?Shell
    2.5.1  運行Spark?Shell命令
    2.5.2  運行Spark?Shell讀取HDFS文件
  2.6  IDEA開發WordCount程序
    2.6.1  以本地模式執行Spark程序
    2.6.2  集群模式執行Spark程序
  2.7  本章小結
  2.8  課後習題

第3章  Spark RDD彈性分散式數據集
  3.1  RDD簡介
  3.2  RDD的創建方式
    3.2.1  從文件系統載入數據創建RDD
    3.2.2  通過並行集合創建RDD
  3.3  RDD的處理過程
    3.3.1  轉換運算元
    3.3.2  行動運算元
    3.3.3  編寫WordCount詞頻統計案例
  3.4  RDD的分區
  3.5  RDD的依賴關係
  3.6  RDD機制
    3.6.1  持久化機制
    3.6.2  容錯機制
  3.7  Spark的任務調度
    3.7.1  DAG的概念
    3.7.2  RDD在Spark中的運行流程
  3.8  本章小結
  3.9  課後習題
第4章  Spark SQL結構化數據文件處理
  4.1  Spark SQL的基礎知識
    4.1.1  Spark SQL的簡介
    4.1.2  Spark SQL架構
  4.2  DataFrame的基礎知識
    4.2.1  DataFrame簡介
    4.2.2  DataFrame的創建
    4.2.3  DataFrame的常用操作
  4.3  Dataset的基礎知識
    4.3.1  Dataset簡介
    4.3.2  Dataset對象的創建
  4.4  RDD轉換為DataFrame
    4.4.1  反射機制推斷Schema
    4.4.2  編程方式定義Schema
  4.5  Spark SQL操作數據源
    4.5.1  操作MySQL
    4.5.2  操作Hive數據集
  4.6  本章小結
  4.7  課後習題
第5章  HBase分散式資料庫
  5.1  HBase的基礎知識
    5.1.1  HBase的簡介
    5.1.2  HBase的數據模型
  5.2  HBase的集群部署
  5.3  HBase的基本操作
    5.3.1  HBase的Shell操作
    5.3.2  HBase的Java API操作
  5.4  深入學習HBase原理
    5.4.1  HBase架構
    5.4.2  物理存儲
    5.4.3  定址機制

    5.4.4  HBase讀寫數據流程
  5.5  HBase和Hive的整合
  5.6  本章小結
  5.7  課後習題
第6章  Kafka分散式發布訂閱消息系統
  6.1  Kafka的基礎知識
    6.1.1  消息傳遞模式簡介
    6.1.2  Kafka簡介
  6.2  Kafka工作原理
    6.2.1  Kafka核心組件介紹
    6.2.2  Kafka工作流程分析
  6.3  Kafka集群部署與測試
    6.3.1  安裝Kafka
    6.3.2  啟動Kafka服務
  6.4  Kafka生產者和消費者實例
    6.4.1  基於命令行方式使用Kafka
    6.4.2  基於Java API方式使用Kafka
  6.5  Kafka Streams
    6.5.1  Kafka Streams概述
    6.5.2  Kafka Streams開發單詞計數應用
  6.6  本章小結
  6.7  課後習題
第7章  Spark Streaming實時計算框架
  7.1  實時計算的基礎知識
    7.1.1  什麼是實時計算
    7.1.2  常用的實時計算框架
  7.2  Spark Streaming的基礎知識
    7.2.1  Spark Streaming簡介
    7.2.2  Spark Streaming工作原理
  7.3  Spark的DStream
    7.3.1  DStream簡介
    7.3.2  DStream編程模型
    7.3.3  DStream轉換操作
    7.3.4  DStream窗口操作
    7.3.5  DStream輸出操作
    7.3.6  DStream實例——實現網站熱詞排序
  7.4  Spark Streaming整合Kafka實戰
    7.4.1  KafkaUtils.createDstream方式
    7.4.2  KafkaUtils.createDirectStream方式
  7.5  本章小結
  7.6  課後習題
第8章  Spark MLlib 機器學習演算法庫
  8.1  初識機器學習
    8.1.1  什麼是機器學習
    8.1.2  機器學習的應用
  8.2  Spark機器學習庫MLlib的概述
    8.2.1  MLlib的簡介
    8.2.2  Spark機器學習工作流程
  8.3  數據類型
    8.3.1  本地向量

    8.3.2  標注點
    8.3.3  本地矩陣
  8.4  Spark MLlib基本統計
    8.4.1  摘要統計
    8.4.2  相關統計
    8.4.3  分層抽樣
  8.5  分類
    8.5.1  線性支持向量機
    8.5.2  邏輯回歸
  8.6  案例——構建推薦系統
    8.6.1  推薦模型分類
    8.6.2  利用MLlib實現電影推薦
  8.7  本章小結
  8.8  課後習題
第9章  綜合案例——Spark實時交易數據統計
  9.1  系統概述
    9.1.1  系統背景介紹
    9.1.2  系統架構設計
    9.1.3  系統預覽
  9.2  Redis資料庫
    9.2.1  Redis介紹
    9.2.2  Redis部署與啟動
    9.2.3  Redis操作及命令
  9.3  模塊開發——構建工程結構
  9.4  模塊開發——構建訂單系統
    9.4.1  模擬訂單數據
    9.4.2  向Kafka集群發送訂單數據
  9.5  模塊開發——分析訂單數據
  9.6  模塊開發——數據展示
    9.6.1  搭建Web開發環境
    9.6.2  實現數據展示功能
    9.6.3  可視化平台展示
  9.7  本章小結

  • 商品搜索:
  • | 高級搜索
首頁新手上路客服中心關於我們聯絡我們Top↑
Copyrightc 1999~2008 美商天龍國際圖書股份有限公司 臺灣分公司. All rights reserved.
營業地址:臺北市中正區重慶南路一段103號1F 105號1F-2F
讀者服務部電話:02-2381-2033 02-2381-1863 時間:週一-週五 10:00-17:00
 服務信箱:bookuu@69book.com 客戶、意見信箱:cs@69book.com
ICP證:浙B2-20060032