幫助中心 | 我的帳號 | 關於我們

大數據技術導論(高職高專大數據技術與應用專業系列教材)

  • 作者:編者:張寺寧|責編:王秀麗//許青青
  • 出版社:西安電子科大
  • ISBN:9787560659787
  • 出版日期:2021/03/01
  • 裝幀:平裝
  • 頁數:251
人民幣:RMB 38 元      售價:
放入購物車
加入收藏夾

內容大鋼
    本書旨在指導高職院校學生對大數據技術進行入門學習,以任務驅動為導向,系統介紹了大數據技術基礎知識及應用案例。全書共分為六大項目,具體包括大數據與大數據時代、大數據處理平台、Hadoop開發環境的搭建、數據採集與預處理、數據計算與數據存儲、數據分析與可視化。
    本書可作為高職院校大數據應用技術、軟體技術等專業學生的專業基礎課教材,也可作為其他電腦相關專業學生的選修課程教材以及大數據技術愛好者的自學參考書。

作者介紹
編者:張寺寧|責編:王秀麗//許青青

目錄
項目一 大數據與大數據時代
  任務1-1 認識大數據時代
    1.1.1  大數據時代
    1.1.2  大數據時代到來的原因
    1.1.3  大數據時代產生的變革
  任務1-2 掌握大數據基本特徵和處理流程
    1.2.1  數據的定義和分類
    1.2.2  大數據的定義
    1.2.3  大數據的特徵
    1.2.4  大數據處理流程
  任務1-3 大數據技術的發展歷程
  任務1-4 大數據產業結構及行業應用
    1.4.1  大數據產業結構
    1.4.2  大數據、雲計算、人工智慧、物聯網的深度融合
    1.4.3  大數據技術在各行業領域的應用案例
  任務1-5 了解大數據行業的崗位需求
    1.5.1  大數據行業的崗位需求
    1.5.2  高職院校學生在大數據行業的就業定位
  小結
  課後習題
項目二 大數據處理平台
  任務2-1 構建大數據處理平台的原因
    2.1.1  大數據時代的數據類型
    2.1.2  傳統數據處理平台遇到的問題
    2.1.3  大數據處理平台
  任務2-2 最早的大數據生態系統—Hadoop
    2.2.1  Hadoop的簡介和發展
    2.2.2  Hadoop的設計思想和特點
    2.2.3  Hadoop的兩大基礎組件
    2.2.4  Hadoop生態系統的架構和其他組件
  任務2-3 大數據處理平台架構
    2.3.1  大數據計算模式
    2.3.2  大數據處理平台的基本架構及數據處理流程
    2.3.3  主流大數據處理平台的架構
    2.3.4  大數據處理平台架構案例介紹
  小結
  課後習題
項目三 Hadoop開發環境的搭建
  任務3-1 VMware虛擬機的安裝
  任務3-2 VMware上Ubuntu系統的安裝和配置
    3.2.1  Ubuntu系統的安裝
    3.2.2  Ubuntu系統的網路設置
  任務3-3 Ubuntu系統上Hadoop的安裝和配置
    3.3.1  Java環境的安裝和配置
    3.3.2  SSH的安裝以及免密碼登錄的設置
    3.3.3  Hadoop的安裝和配置
  任務3-4 Hadoop下的詞頻統計
  小結
  課後習題
項目四 數據採集與預處理

  任務4-1 數據採集初識
    4.1.1  傳統數據採集和大數據採集
    4.1.2  大數據採集方式
    4.1.3  大數據採集工具
    4.1.4  數據預處理
  任務4-2 互聯網數據採集
    4.2.1  爬蟲
    4.2.2  爬蟲編程語言及爬蟲分類
  任務4-3 Windows下Python爬蟲開發環境的搭建
    4.3.1  Windows下Python3.x的安裝和環境變數的配置
    4.3.2  requests和Beautiful Soup包的安裝
    4.3.3  PyCharm的安裝和使用
  任務4-4 Python爬蟲應用程序的編寫
    4.4.1  爬蟲爬取數據的過程
    4.4.2  網頁的基本結構
    4.4.3  網站數據的抓取
    4.4.4  網站數據的解析與數據清洗
    4.4.5  數據的爬取與預處理
  小結
  課後習題
項目五 數據計算與數據存儲
  任務5-1 大數據計算框架初識
    5.1.1  大數據計算和傳統數據計算的區別
    5.1.2  常見的大數據計算框架簡介
  任務5-2 大數據存儲初識
    5.2.1  分散式文件系統
    5.2.2  NoSQL資料庫簡介
    5.2.3  HBase簡介
  任務5-3 Spark和HBase開發環境的搭建
    5.3.1  HBase的安裝和配置
    5.3.2  Spark的安裝和配置
  任務5-4 Spark應用程序的編寫
    5.4.1  Linux下Scala IDE For Eclipse工具的安裝和配置
    5.4.2  Spark應用程序的編寫及打包
    5.4.3  Spark應用程序jar包的提交
  小結
  課後習題
項目六 數據分析與可視化
  任務6-1 大數據分析初識
    6.1.1  大數據分析簡介
    6.1.2  Python大數據分析環境的搭建
    6.1.3  常見的大數據分析方法
  任務6-2 大數據可視化初識
    6.2.1  大數據可視化的概念
    6.2.2  常用的數據可視化工具
  任務6-3 房屋數據分析可視化案例編程
    6.3.1  PySpark的配置和使用
    6.3.2  Spark應用程序的編寫
  小結
  課後習題

參考文獻

  • 商品搜索:
  • | 高級搜索
首頁新手上路客服中心關於我們聯絡我們Top↑
Copyrightc 1999~2008 美商天龍國際圖書股份有限公司 臺灣分公司. All rights reserved.
營業地址:臺北市中正區重慶南路一段103號1F 105號1F-2F
讀者服務部電話:02-2381-2033 02-2381-1863 時間:週一-週五 10:00-17:00
 服務信箱:bookuu@69book.com 客戶、意見信箱:cs@69book.com
ICP證:浙B2-20060032