幫助中心 | 我的帳號 | 關於我們

大數據導論(科大訊飛校企合編教材)

  • 作者:編者:于俊偉//母亞雙//閆秋玲|責編:王繼偉//楊爽
  • 出版社:北京大學
  • ISBN:9787301333341
  • 出版日期:2022/10/01
  • 裝幀:平裝
  • 頁數:243
人民幣:RMB 69 元      售價:
放入購物車
加入收藏夾

內容大鋼
    本書圍繞新工科背景下大數據人才培養需求編寫,既涵蓋了大數據的基礎知識,又介紹了大數據分析的相關工具與案例。全書共9章,系統介紹了大數據採集與預處理、大數據存儲與管理、大數據處理與分析、大數據可視化處理流程;重點分析了科大訊飛大數據平台在政務、交通、金融和用戶畫像等實際場景中的應用,還介紹了大數據實驗環境的詳細搭建步驟,方便讀者快速理解和體驗大數據應用技術;最後介紹了大數據治理中法律政策、行業標準建設的最新進展,分析了大數據可能帶來的倫理風險和應對策略。
    本書將大數據基礎理論與實際案例結合,輔以編程實踐和有針對性的課後習題,可作為高等院校數據科學與大數據技術專業的導論課教材,也可作為大數據相關從業人員的技術參考書。

作者介紹
編者:于俊偉//母亞雙//閆秋玲|責編:王繼偉//楊爽

目錄
第1章  大數據概述
  1.1  大數據的產生及其特徵
    1.1.1  大數據的產生
    1.1.2  大數據的特徵
  1.2  大數據發展
    1.2.1  大數據發展歷程
    1.2.2  國外大數據戰略
    1.2.3  中國大數據戰略與政策
    1.2.4  大數據立法和標準
  1.3  大數據思維
    1.3.1  大數據的價值
    1.3.2  大數據的思維變革
  1.4  大數據應用
    1.4.1  大數據應用層次
    1.4.2  大數據應用領域
  1.5  大數據技術與工具
    1.5.1  大數據處理流程
    1.5.2  大數據行業全景圖
    1.5.3  大數據分析平台
    1.5.4  大數據編程語言
  1.6  本章小結
  1.7  習題
第2章  大數據採集與預處理
  2.1  概述
  2.2  大數據的來源
  2.3  大數據的採集方法
    2.3.1  資料庫採集
    2.3.2  系統日誌採集
    2.3.3  網路數據採集
    2.3.4  其他數據採集
  2.4  大數據預處理方法
    2.4.1  數據清洗
    2.4.2  數據集成
    2.4.3  數據變換
  2.5  大數據採集與預處理工具
    2.5.1  網路爬蟲 Scrapy
    2.5.2  流數據採集 Kafka
    2.5.3  ETL 工具 Kettle
  2.6  本章小結
  2.7  習題
第3章  大數據存儲與管理技術
  3.1  大數據存儲與管理技術概述
  3.2  分散式文件系統
    3.2.1  HDFS
    3.2.2  Ceph
    3.2.3  GlusterFS
  3.3  NoSQL資料庫
    3.3.1  鍵值資料庫
    3.3.2  列族資料庫
    3.3.3  文檔資料庫

    3.3.4  圖資料庫
  3.4  大數據查詢系統
    3.4.1  大數據查詢系統概述
    3.4.2  Dremel
  3.5  數據倉庫
    3.5.1  數據倉庫的特點
    3.5.2  關係型數據倉庫體系結構
    3.5.3  數據倉庫 Hive
    3.5.4  數據倉庫 Impala
  3.6  本章小結
  3.7  習題
第4章  大數據處理與分析系統
  4.1  概述
  4.2  谷歌大數據處理系統
    4.2.1  GFS
    4.2.2  MapReduce
    4.2.3  BigTable
  4.3  分散式計算框架 Hadoop MapReduce
    4.3.1  Hadoop MapReduce概述
    4.3.2  Hadoop MapReduce應用舉例
  4.4  快速計算框架 Spark
    4.4.1  Spark簡介
    4.4.2  Spark運行架構
    4.4.3  Spark的部署方式
    4.4.4  Spark的數據抽象RDD
    4.4.5  Spark MLlib
    4.4.6  Spark Streaming
    4.4.7  Spark SQL
    4.4.8  Spark GraphX
  4.5  其他大數據分析系統
    4.5.1  圖計算系統Pregel
    4.5.2  流處理系統Flink
  4.6  本章小結
  4.7  習題
第5章  大數據機器學習
  5.1  機器學習簡介
    5.1.1  機器學習的定義
    5.1.2  機器學習的分類
    5.1.3  機器學習的歷史
    5.1.4  機器學習與數據挖掘的關係
  5.2  數據
    5.2.1  數據概述
    5.2.2  帶有標籤的數據和不帶標籤的數據
    5.2.3  訓練數據、測試數據、驗證數據
  5.3  有監督學習
    5.3.1  有監督學習簡介
    5.3.2  回歸
    5.3.3  分類
    5.3.4  常見的有監督學習方法
  5.4  無監督學習

    5.4.1  無監督學習簡介
    5.4.2  聚類
    5.4.3  關聯分析
  5.5  強化學習
    5.5.1  強化學習簡介
    5.5.2  強化學習主流演算法
    5.5.3  強化學習的使用場景
  5.6  弱監督學習
    5.6.1  弱監督學習簡介
    5.6.2  弱監督學習的分類
  5.7  機器學習的相關資源與工具
  5.8  本章小結
  5.9  習題
第6章  數據可視化
  6.1  可視化概述
    6.1.1  可視化的含義
    6.1.2  可視化的發展歷程
    6.1.3  可視化的作用
  6.2  數據可視化及其分類
    6.2.1  科學可視化
    6.2.2  信息可視化
    6.2.3  可視化分析學
  6.3  數據可視化工具
    6.3.1  入門級工具
    6.3.2  信息圖表工具
    6.3.3  地圖工具
    6.3.4  基於編程語言的可視化庫
  6.4  本章小結
  6.5  習題
第7章  大數據行業應用案例
  7.1  大數據行業應用概述
  7.2  政務大數據
  7.3  交通大數據
    7.3.1  人群生活模式劃分
    7.3.2  道路擁堵模式預測
  7.4  徵信大數據
    7.4.1  企業徵信大數據應用
    7.4.2  企業法人資產建模實踐
  7.5  畫像大數據
    7.5.1  用戶畫像概述
    7.5.2  構建用戶畫像流程
    7.5.3  構建用戶畫像
    7.5.4  用戶畫像評估和使用
  7.6  本章小結
  7.7  習題
第8章  大數據平台與實驗環境
  8.1  大數據平台與環境概述
    8.1.1  大數據平台簡介
    8.1.2  搭建環境簡介
  8.2  安裝虛擬機

  8.3  在虛擬機中安裝Linux系統
  8.4  為Ubuntu系統配置Java開發環境
  8.5  在Ubuntu系統中安裝Hadoop
    8.5.1  查詢和更改主機名
    8.5.2  更改host文件
    8.5.3  認證SSH實現無密碼登錄
8.5.4 複製Hadoop 2.6.0到指定目錄並解壓
    8.5.5  配置文件
    8.5.7  啟動、驗證和關閉Hadoop
  8.6  安裝Eclipse和Eclipse-hadoop-plugin
    8.6.1  安裝Eclipse
    8.6.2  配置Eclipse-hadoop-plugin
  8.7  新建、導入、運行與調試 Hadoop 工程
    8.7.1  新建Hadoop 工程
    8.7.2  導入已有的Hadoop工程
    8.7.3  運行Hadoop工程
    8.7.4  調試Hadoop工程
  8.8  本章小結
  8.9  習題
第9章  大數據治理
  9.1  大數據治理體系
  9.2  大數據法律政策
  9.3  大數據行業標準
  9.4  大數據治理內容
  9.5  大數據倫理風險
  9.6  本章小結
  9.7  習題
主要參考文獻

  • 商品搜索:
  • | 高級搜索
首頁新手上路客服中心關於我們聯絡我們Top↑
Copyrightc 1999~2008 美商天龍國際圖書股份有限公司 臺灣分公司. All rights reserved.
營業地址:臺北市中正區重慶南路一段103號1F 105號1F-2F
讀者服務部電話:02-2381-2033 02-2381-1863 時間:週一-週五 10:00-17:00
 服務信箱:bookuu@69book.com 客戶、意見信箱:cs@69book.com
ICP證:浙B2-20060032