幫助中心 | 我的帳號 | 關於我們

大數據技術基礎(第2版高等學校大數據技術精品教材)/電腦技術入門叢書

  • 作者:編者:宋旭東|責編:賈斌//薛陽
  • 出版社:清華大學
  • ISBN:9787302667308
  • 出版日期:2024/08/01
  • 裝幀:平裝
  • 頁數:313
人民幣:RMB 59.8 元      售價:
放入購物車
加入收藏夾

內容大鋼
    本書系統介紹了大數據基礎知識和相關技術,全書分為大數據基礎、大數據存儲與管理篇、大數據採集與預處理、大數據分析與挖掘、大數據平台Hadoop實踐與應用案例5篇,共17章,主要內容包括大數據基本概念、大數據平台Hadoop基礎、大數據存儲與管理基本概念、大數據分散式文件系統HDFS、大數據分散式資料庫系統HBase、大數據分散式數據倉庫系統Hive、大數據採集與預處理技術、大數據採集工具,大數據計算模式、大數據MapReduce計算模型、大數據Spark計算模型、大數據Flink計算模型、大數據MapReduce基礎演算法、大數據挖掘演算法、Hadoop大數據平台實踐、開敞式碼頭系泊纜力預測應用案例以及曙光XData大數據平台及應用案例。全書提供了大量應用實例,且大多章后附有習題。本書特色在於融會貫通大數據基本概念與大數據技術及應用,很好地將大數據概念、技術及應用融合在一起,便於讀者更好地理解大數據基本概念,更快掌握大數據前沿技術及其應用。
    本書適合作為高等院校電腦、軟體工程、信息管理等相關專業的本科生及研究生大數據技術課程的教學用書,也可作為相關IT工程技術人員的參考用書,

作者介紹
編者:宋旭東|責編:賈斌//薛陽

目錄
第1篇  大數據基礎
  第1章  大數據基本概念
    1.1  大數據時代
      1.1.1  大數據有多大
      1.1.2  大數據的產生
      1.1.3  大數據的發展歷程
      1.1.4  大數據對科學研究的影響
      1.1.5  大數據對思維模式的影響
    1.2  大數據的定義與特徵
      1.2.1  大數據的定義
      1.2.2  大數據的數據特徵
    1.3  大數據的應用
      1.3.1  大數據在科研領域的應用
      1.3.2  大數據在交通領域的應用
      1.3.3  大數據在通信領域的應用
      1.3.4  大數據在醫療領域的應用
      1.3.5  大數據在金融領域的應用
      1.3.6  大數據在製造領域的應用
      1.3.7  大數據在體育領域的應用
      1.3.8  大數據在個性化生活領域的應用
      1.3.9  大數據在安全領域的應用
    1.4  大數據框架體系
      1.4.1  大數據基礎設施層
      1.4.2  大數據採集層
      1.4.3  大數據存儲層
      1.4.4  大數據處理層
      1.4.5  大數據交互展示層
      1.4.6  大數據應用層
    1.5  大數據關鍵技術
      1.5.1  數據採集與預處理技術
      1.5.2  數據存儲和管理技術
      1.5.3  數據分析與挖掘技術
      1.5.4  數據可視化技術
      1.5.5  數據安全和隱私保護技術
    1.6  大數據支撐技術
      1.6.1  雲計算
      1.6.2  物聯網
      1.6.3  人工智慧
    習題
  第2章  大數據平台Hadoop基礎
    2.1  大數據平台Hadoop概述
      2.1.1  Hadoop簡介
      2.1.2  Hadoop項目起源
      2.1.3  Hadoop發展歷程
      2.1.4  Hadoop特性
      2.1.5  Hadoop主要用途
    2.2  大數據平台Hadoop原理
      2.2.1  分散式計算原理
      2.2.2  MapReduce原理
      2.2.3  Yarn原理

    2.3  大數據平台Hadoop組件
      2.3.1  HDFS組件
      2.3.2  MapReduce組件
      2.3.3  ZooKeeper組件
      2.3.4  Yarn組件
      2.3.5  HBase組件
      2.3.6  Hive組件
      2.3.7  Spark組件
      2.3.8  Mahout組件
      2.3.9  Flume組件
      2.3.10  Sqoop組件
      2.3.11  Kafka組件
      2.3.12  Pig組件
      2.3.13  Ambari組件
      2.3.14  Tez組件
      2.3.15  Common組件
    習題
第2篇  大數據存儲與管理
  第3章  大數據存儲與管理基本概念
    3.1  大數據的數據類型
      3.1.1  結構化數據
      3.1.2  半結構化數據
      3.1.3  非結構化數據
    3.2  數據管理技術的發展
      3.2.1  文件系統階段
      3.2.2  資料庫系統階段
      3.2.3  數據倉庫階段
      3.2.4  分散式系統階段
    3.3  分散式系統基礎理論
      3.3.1  CAP理論
      3.3.2  BASE思想
    3.4  NoSQL資料庫
      3.4.1  NoSQL資料庫的興起
      3.4.2  NoSQL資料庫與關係資料庫的比較
      3.4.3  NoSQL資料庫的4大類型
    3.5  大數據存儲與管理技術
      3.5.1  分散式存儲技術
      3.5.2  虛擬化技術
      3.5.3  雲存儲技術
    習題
  第4章  大數據分散式文件系統HDFS
    4.1  HDFS概述
      4.1.1  HDFS簡介
      4.1.2  HDFS設計特點
    4.2  HDFS工作原理
      4.2.1  HDFS體系結構
      4.2.2  HDFS工作組件
    4.3  HDFS工作流程
      4.3.1  讀數據的過程
      4.3.2  寫數據的過程

    4.4  HDFS基本操作
      4.4.1  HDFS文件操作
      4.4.2  HDFS管理命令
    4.5  HDFS編程介面
      4.5.1  HDFS常用Java API
      4.5.2  HDFS API編程實例
    習題
  第5章  大數據分散式資料庫系統HBase
    5.1  HBase概述
      5.1.1  HBase簡介
      5.1.2  HBase特性
      5.1.3  HBase與傳統關係資料庫對比
      5.1.4  HBase應用場景
    5.2  HBase數據模型
      5.2.1  HBase數據模型術語
      5.2.2  HBase數據邏輯模型
      5.2.3  HBase數據物理模型
    5.3  HBase工作原理
      5.3.1  HBase體系結構
      5.3.2  HBase工作組件
    5.4  HBase安裝
      5.4.1  下載HBase
      5.4.2  安裝HBase
      5.4.3  啟動HBase
      5.4.4  關閉HBase
    5.5  HBase操作命令
      5.5.1  HBase表操作
      5.5.2  HBase數據操作
    5.6  HBase編程介面
      5.6.1  HBase常用Java API
      5.6.2  HBase API編程實例
    習題
  第6章  大數據分散式數據倉庫系統Hive
    6.1  Hive概述
      6.1.1  Hive特性
      6.1.2  Hive工作原理
      6.1.3  Hive執行流程
    6.2  Hive數據類型及數據模型
      6.2.1  Hive數據類型
      6.2.2  Hive數據模型
    6.3  安裝Hive
      6.3.1  下載Hive
      6.3.2  安裝配置Hive
      6.3.3  安裝MySQL
      6.3.4  配置MySQL允許Hive接入
      6.3.5  啟動Hive
      6.3.6  關閉Hive
    6.4  Hive SQL
      6.4.1  DDL語句
      6.4.2  DML語句

      6.4.3  DQL語句
      6.4.4  Hive操作實例
    6.5  Hive訪問介面
      6.5.1  Hive CLI訪問介面
      6.5.2  JDBC訪問介面
    習題
  第3篇大數據採集與預處理
  第7章  大數據採集與預處理技術
    7.1  數據抽取、轉換、載入技術
      7.1.1  ETL概述
      7.1.2  數據抽取
      7.1.3  數據轉換
      7.1.4  數據載入
      7.1.5  ETL工具
    7.2  數據爬蟲技術
      7.2.1  爬蟲流程
      7.2.2  爬蟲分類
      7.2.3  大數據爬蟲技術
    7.3  數據預處理技術
      7.3.1  數據清理
      7.3.2  數據集成
      7.3.3  數據變換
      7.3.4  數據歸約
    習題
  第8章  大數據採集工具
    8.1  Sqoop關係型大數據採集系統
      8.1.1  Sqoop簡介
      8.1.2  Sqoop工作原理
    8.2  Flume日誌大數據採集系統
      8.2.1  Flume簡介
      8.2.2  Flume工作原理
      8.2.3  Flume的配置與啟動
    8.3  Kafka消息隊列大數據採集系統
      8.3.1  Kafka簡介
      8.3.2  Kafka工作原理
      8.3.3  Kafka的配置與啟動
    8.4  Nutch分散式大數據爬蟲系統
      8.4.1  Nutch簡介
      8.4.2  Nutch工作原理
    習題
第4篇  大數據分析與挖掘
  第9章  大數據計算模式
    9.1  大數據批處理
      9.1.1  大數據批處理概述
      9.1.2  大數據批處理常用組件
    9.2  大數據查詢分析計算
      9.2.1  大數據查詢分析計算概述
      9.2.2  大數據查詢分析計算組件
    9.3  大數據流計算
      9.3.1  大數據流計算概述

      9.3.2  大數據流計算組件
    9.4  大數據迭代計算
      9.4.1  大數據迭代計算概述
      9.4.2  迭代計算組件
    9.5  大數據圖計算
      9.5.1  大數據圖計算概述
      9.5.2  圖計算組件
    習題
  第10章  大數據MapReduce計算模型
    10.1  MapReduce概述
      10.1.1  MapReduce簡介
      10.1.2  MapReduce由來
      10.1.3  MapReduce主要功能
      10.1.4  MapReduce技術特徵
    10.2  MapReduce模型框架
      10.2.1  MapReduce設計思想
      10.2.2  MapReduce模型架構
    10.3  MapReduce數據處理過程
      10.3.1  MapReduce運行原理
      10.3.2  數據輸入輸出流程
    10.4  MapReduce程序執行過程
      10.4.1  作業提交
      10.4.2  作業初始化
      10.4.3  作業分配
      10.4.4  任務執行
      10.4.5  過程和狀態更新
      10.4.6  作業完成
    10.5  MapReduce編程介面
      10.5.1  數據讀入
      10.5.2  Mapper類和Reducer類
      10.5.3  數據處理
      10.5.4  數據輸出
    10.6  MapReduce實例分析
      10.6.1  WordCount MapReduce設計
      10.6.2  WordCount編程實現
    習題
  第11章  大數據Spark計算模型
    11.1  Spark概述
      11.1.1  Spark產生
      11.1.2  Spark的相關概念及其組件
      11.1.3  Spark特性
    11.2  Spark工作原理
      11.2.1  RDD原理
      11.2.2  Spark工作流程
      11.2.3  Spark集群架構及運行模式
      11.2.4  Spark Streaming工作原理
    11.3  Spark訪問介面
      11.3.1  Spark訪問介面概述
      11.3.2  SparkContext訪問介面
      11.3.3  RDD訪問介面

    11.4  Spark實例分析
      11.4.1  Spark Shell WordCount編程實現
      11.4.2  Scala WordCount編程實現
      11.4.3  Java WordCount編程實現
    習題
  第12章  大數據Flink計算模型
    12.1  Flink概述
      12.1.1  Flink簡介
      12.1.2  Flink的由來
      12.1.3  Flink流處理
      12.1.4  Flink的核心特性
    12.2  Flink工作原理
      12.2.1  Flink的計算框架
      12.2.2  Flink的體系結構
      12.2.3  Flink的運行架構
    12.3  Flink編程介面
      12.3.1  Flink的編程模型
      12.3.2  Flink的編程結構
    12.4  Flink實例分析
      12.4.1  Scala WordCount編程實現
      12.4.2  Java WordCount編程實現
    習題
  第13章  大數據MapReduce基礎演算法
    13.1  關係代數運算
      13.1.1  關係代數運算規則
      13.1.2  關係代數運算的MapReduce設計與實現
    13.2  矩陣乘法
      13.2.1  矩陣乘法原理
      13.2.2  矩陣乘法MapReduce設計
      13.2.3  矩陣乘法MapReduce實現
    習題
  第14章  大數據挖掘演算法
    14.1  大數據關聯分析演算法
      14.1.1  Apriori演算法簡介
      14.1.2  Apriori演算法MapReduce設計
      14.1.3  Apriori演算法MapReduce實現
    14.2  大數據KNN分類演算法
      14.2.1  KNN分類演算法簡介
      14.2.2  KNN演算法MapReduce設計
      14.2.3  KNN演算法MapReduce實現
    14.3  大數據K?Means聚類演算法
      14.3.1  K?Means聚類演算法簡介
      14.3.2  基於MapReduce的K?Means演算法的設計
      14.3.3  基於MapReduce的K?Means演算法的實現
    14.4  大數據回歸分析演算法
      14.4.1  大數據回歸分析演算法簡介
      14.4.2  基於MapReduce的多元回歸分析演算法設計
      14.4.3  基於MapReduce的多元回歸分析演算法的實現
    習題
第5篇  大數據平台Hadoop實踐與應用案例

  第15章  Hadoop大數據平台實踐
    15.1  Hadoop系統的安裝與配置
      15.1.1  安裝前的準備工作
      15.1.2  Linux虛擬機的安裝
      15.1.3  安裝和配置JDK
      15.1.4  下載安裝Hadoop
      15.1.5  SSH免密登錄
      15.1.6  虛擬機克隆
      15.1.7  Hadoop運行
      15.1.8  查看集群狀態
    15.2  Hadoop平台基本操作
      15.2.1  Hadoop啟動與關閉命令
      15.2.2  Hadoop文件操作
      15.2.3  Hadoop程序運行命令
    15.3  Hadoop平台程序開發過程
      15.3.1  開發環境配置
      15.3.2  程序開發流程
    習題
  第16章  開敞式碼頭系泊纜力預測應用案例
    16.1  開敞式碼頭系泊纜力預測背景描述
      16.1.1  開敞式碼頭系泊作業背景描述
      16.1.2  開敞式碼頭系泊纜力預測背景
    16.2  大數據系泊纜力相似性查詢預測方法
      16.2.1  模糊相似性查詢基本方法
      16.2.2  系泊纜力相似性查詢預測模型
    16.3  相似性查詢預測方法MapReduce設計
      16.3.1  相似性查詢預測方法Map設計
      16.3.2  相似性查詢預測方法Reduce設計
    16.4  相似性查詢預測方法MapReduce實現
      16.4.1  系泊纜力預測結果展示
      16.4.2  系泊纜力預測結果分析
  第17章  曙光XData大數據平台及應用案例
    17.1  曙光XData大數據平台簡介
      17.1.1  曙光XData大數據平台概述
      17.1.2  曙光XData大數據平台特點及應用
    17.2  曙光大數據平台架構及關鍵技術
      17.2.1  曙光XData大數據平台架構
      17.2.2  曙光XData大數據平台關鍵技術
    17.3  曙光XData大數據平台組件
      17.3.1  曙光XData大數據集成與數據治理組件
      17.3.2  曙光XData大數據存儲與數據計算組件
      17.3.3  曙光XData大數據分析與數據智能組件
      17.3.4  曙光XData大數據可視化分析組件
      17.3.5  曙光XData大數據安全管控與管理運維組件
    17.4  曙光XData大數據平台操作實踐
      17.4.1  曙光XData大數據平台安裝與配置概述
      17.4.2  曙光XData大數據平台基本操作
    17.5  基於曙光XData大數據平台的智能交通應用案例
      17.5.1  曙光XData智能交通應用項目背景
      17.5.2  曙光XData智能交通應用方案設計

      17.5.3  曙光XData智能交通功能實現及應用效果
參考文獻

  • 商品搜索:
  • | 高級搜索
首頁新手上路客服中心關於我們聯絡我們Top↑
Copyrightc 1999~2008 美商天龍國際圖書股份有限公司 臺灣分公司. All rights reserved.
營業地址:臺北市中正區重慶南路一段103號1F 105號1F-2F
讀者服務部電話:02-2381-2033 02-2381-1863 時間:週一-週五 10:00-17:00
 服務信箱:bookuu@69book.com 客戶、意見信箱:cs@69book.com
ICP證:浙B2-20060032