幫助中心 | 我的帳號 | 關於我們

大數據技術與應用(微課視頻版)/大數據與人工智慧技術叢書

  • 作者:編者:肖政宏//李俊傑//謝志明|責編:王冰飛
  • 出版社:清華大學
  • ISBN:9787302538431
  • 出版日期:2020/06/01
  • 裝幀:平裝
  • 頁數:329
人民幣:RMB 49.8 元      售價:
放入購物車
加入收藏夾

內容大鋼
    本書共分12章,分為基礎篇、核心篇和應用篇。基礎篇包括大數據概論、大數據集群系統基礎、Hadoop分散式系統、HDFS分散式文件系統、MapReduce分散式計算、HBase分散式資料庫應用;核心篇包括YARN資源分配、Spark集群計算、Spark機器學習、Hive數據倉庫應用、ZooKeeper協調服務;應用篇包括醫藥大數據案例分析。
    本書可以作為高等院校大數據技術相關課程本科生教材,也可以作為大數據技術基礎相關課程研究生教材,還可以作為從事大數據相關工作的工程技術人員的參考用書。

作者介紹
編者:肖政宏//李俊傑//謝志明|責編:王冰飛

目錄
基礎篇
  第1章  大數據概論
    1.1  大數據概述
      1.1.1  大數據的定義
      1.1.2  大數據的特徵
    1.2  大數據的分析過程
      1.2.1  大數據的採集
      1.2.2  大數據的存儲方式
      1.2.3  大數據分析技術
      1.2.4  大數據的展示及應用
    1.3  大數據的價值、挑戰與風險
      1.3.1  商業價值
      1.3.2  社會生活價值
      1.3.3  大數據的挑戰與風險
    1.4  大數據的應用
    1.5  大數據的處理流程
    1.6  大數據成為人工智慧產業的燃料
    1.7  大數據技術的發展前景
    小結
    習題
  第2章  大數據集群系統基礎
    2.1  大數據集群系統概述
      2.1.1  集群的分類
      2.1.2  集群的目的
    2.2  Linux操作系統
      2.2.1  Linux操作系統簡介
      2.2.2  Linux操作系統的特性
      2.2.3  Linux安裝與基礎操作
      2.2.4  Linux常用命令
    2.3  虛擬化技術
      2.3.1  虛擬化技術簡介
      2.3.2  虛擬技術的原理
      2.3.3  常見的虛擬化軟體
      2.3.4  虛擬化技術的優勢和劣勢
    2.4  CentOS大數據集群系統的組成
    2.5  大數據集群技術的架構
    2.6  操作實踐: 大數據集群的部署
      2.6.1  集群規劃
      2.6.2  網路配置
      2.6.3  安全配置
      2.6.4  時間同步
      2.6.5  SSH登錄
    小結
    習題
  第3章  Hadoop分散式系統
    3.1  Hadoop概述
      3.1.1  Hadoop簡介
      3.1.2  Hadoop的發展歷程
      3.1.3  Hadoop原理及運行機制
    3.2  Hadoop相關技術及生態系統

    3.3  操作實踐: Hadoop安裝與配置
      3.3.1  安裝JDK
      3.3.2  安裝Hadoop
      3.3.3  配置Hadoop
      3.3.4  格式化
      3.3.5  運行Hadoop
    小結
    習題
  第4章  HDFS分散式文件系統
    4.1  HDFS
      4.1.1  設計前提和設計目標
      4.1.2  Namenode和Datanode
      4.1.3  文件系統的名字空間
      4.1.4  數據複製
      4.1.5  HDFS讀流程
      4.1.6  HDFS寫流程
    4.2  HDFS操作實踐
      4.2.1  HDFS Shell
      4.2.2  HDFS Java API
      4.2.3  Eclipse開發環境
      4.2.4  綜合實例
    小結
    習題
  第5章  MapReduce分散式計算
    5.1  MapReduce簡介
      5.1.1  MapReduce架構
      5.1.2  MapReduce的原理
      5.1.3  MapReduce的工作機制
    5.2  MapReduce操作實踐
      5.2.1  MapReduce WordCount編程實例
      5.2.2  MapReduce倒排索引編程實例
    小結
    習題
  第6章  HBase分散式資料庫應用
    6.1  HBase簡介
      6.1.1  HBase架構
      6.1.2  HBase的存儲
    6.2  HBase集群部署
      6.2.1  HBase參數配置
      6.2.2  HBase運行與測試
    6.3  HBase Shell操作命令
      6.3.1  general操作
      6.3.2  namespace操作
      6.3.3  DDL操作
      6.3.4  DML操作
      6.3.5  授權
    6.4  HBase過濾器
    6.5  HBase編程
      6.5.1  HBase表操作編程
      6.5.2  HBase過濾查詢編程

    小結
    習題
核心篇
  第7章  YARN資源分配
    7.1  統一資源管理和調度平台引例
      7.1.1  背景
      7.1.2  特點
      7.1.3  典型的統一資源調度平台
    7.2  YARN簡介
      7.2.1  YARN架構
      7.2.2  YARN的工作流程
      7.2.3  YARN的優勢
    7.3  操作實踐: YARN Shell實例
    小結
    習題
  第8章  Spark集群計算
    8.1  Spark簡介
      8.1.1  Spark生態系統
      8.1.2  Spark架構
    8.2  Spark RDD
      8.2.1  RDD的依賴關係
      8.2.2  作業調度
      8.2.3  內存管理
      8.2.4  檢查點支持
    8.3  Spark集群部署及應用案例
      8.3.1  Spark參數配置
      8.3.2  Spark集群運行
      8.3.3  Spark交互
      8.3.4  Spark運算元
      8.3.5  Spark演算法實例1: 詞頻統計
      8.3.6  Spark演算法實例2: 相關係數
    小結
    習題
  第9章  Spark機器學習
    9.1  機器學習概述
      9.1.1  機器學習的發展史
      9.1.2  機器學習步驟
    9.2  Spark MLlib概述
      9.2.1  數據類型
      9.2.2  基本統計——基於DataFrame的API
      9.2.3  基本統計——基於RDD的API
    9.3  Spark實例
      9.3.1  聚類問題
      9.3.2  隨機森林
    小結
    習題
  第10章  Hive數據倉庫應用
    10.1  Hive簡介
      10.1.1  Hive組成模塊
      10.1.2  Hive執行流程

      10.1.3  MetaStore存儲模式
    10.2  Hive安裝與配置
      10.2.1  Hive參數配置
      10.2.2  Hive運行與測試
      10.2.3  Hive Beeline
    10.3  數據類型和文件格式
      10.3.1  數據類型
      10.3.2  文件格式
    10.4  Hive數據定義與數據操作
      10.4.1  基本概念
      10.4.2  資料庫管理
      10.4.3  表的管理
      10.4.4  外部表的管理
      10.4.5  分區管理
      10.4.6  數據操作
      10.4.7  桶的操作
      10.4.8  索引
    10.5  Hive數據查詢
      10.5.1  簡單查詢
      10.5.2  複雜查詢
      10.5.3  JOIN連接查詢
      10.5.4  其他語句
    10.6  Hive編程
      10.6.1  JDBC函數
      10.6.2  完整實例
    小結
    習題
  第11章  ZooKeeper協調服務
    11.1  ZooKeeper簡介
      11.1.1  ZAB協議
      11.1.2  ZooKeeper數據模型
      11.1.3  會話
      11.1.4  事件監聽器
      11.1.5  訪問許可權
    11.2  ZooKeeper集群部署
    11.3  ZooKeeper基本命令
    11.4  ZooKeeper應用
      11.4.1  Hadoop
      11.4.2  Spark
      11.4.3  Hive
    11.5  ZooKeeper編程
      11.5.1  ZooKeeper讀/寫操作
      11.5.2  集群狀態監控
    小結
    習題
應用篇
  第12章  醫藥大數據案例分析
    12.1  項目概述
    12.2  功能需求
    12.3  軟體關鍵技術

    12.4  效果展示
    12.5  系統構架設計
      12.5.1  系統組成
      12.5.2  系統協作方式
      12.5.3  系統網路拓撲
      12.5.4  系統建設方案
    12.6  數據存儲設計
    12.7  數據分析
    12.8  數據展示
    小結
    習題
參考文獻

  • 商品搜索:
  • | 高級搜索
首頁新手上路客服中心關於我們聯絡我們Top↑
Copyrightc 1999~2008 美商天龍國際圖書股份有限公司 臺灣分公司. All rights reserved.
營業地址:臺北市中正區重慶南路一段103號1F 105號1F-2F
讀者服務部電話:02-2381-2033 02-2381-1863 時間:週一-週五 10:00-17:00
 服務信箱:bookuu@69book.com 客戶、意見信箱:cs@69book.com
ICP證:浙B2-20060032