幫助中心 | 我的帳號 | 關於我們

大數據採集預處理與可視化(微課版)/大數據應用人才能力培養新形態系列

  • 作者:編者:葛繼科//張曉琴//陳祖琴|責編:王宣
  • 出版社:人民郵電
  • ISBN:9787115614353
  • 出版日期:2023/07/01
  • 裝幀:平裝
  • 頁數:279
人民幣:RMB 69.8 元      售價:
放入購物車
加入收藏夾

內容大鋼
    為了適應數字經濟時代的新發展趨勢,培養新時代大數據專業人才,編者通過總結多年的教學經驗,借鑒國內外相關領域的教學優勢,詳細剖析大數據採集、預處理與可視化的基礎理論、關鍵技術、相關工具和應用案例,進而編成本書。
    本書是集理論與實踐于一體的應用型教材。全書共7章,包括大數據概述、Python程序設計、大數據採集、大數據預處理技術、Excel數據獲取與預處理、Python數據預處理、數據可視化技術。本書在編寫中著重介紹基本原理,同時突出工程應用,並以清晰、容易理解的方式展現大數據採集、預處理與可視化的基礎知識、基本任務、常用方法、實用場景和主要流程,力圖做到基本概念準確、闡述條理清晰、主體內容精練、重點難點突出、理論聯繫實際。此外,本書還將反映相關領域新技術的發展情況。
    本書可作為電腦、人工智慧、大數據、電子商務、電氣、電子、統計學、會計學等相關專業的大數據技術類課程的教材,也可供相關領域的科技人員參考使用,還可作為數據分析及應用類認證培訓課程用書。

作者介紹
編者:葛繼科//張曉琴//陳祖琴|責編:王宣

目錄
第1章  大數據概述
  1.1  大數據時代
  1.2  大數據的相關概念及特徵
    1.2.1  大數據的概念
    1.2.2  大數據的發展歷程
    1.2.3  大數據的特徵
    1.2.4  大數據的作用
    1.2.5  大數據的應用領域
    1.2.6  大數據的關鍵技術
  1.3  大數據系統簡介
    1.3.1  Hadoop生態系統
    1.3.2  Spark生態系統
  1.4  大數據思維
    1.4.1  傳統思維方式
    1.4.2  大數據思維方式
  1.5  大數據倫理
    1.5.1  大數據倫理的由來
    1.5.2  大數據的倫理問題
    1.5.3  大數據的倫理原則
  1.6  大數據安全
    1.6.1  數據全生命周期安全
    1.6.2  大數據安全防護技術
  1.7  本章小結
  1.8  習題
第2章  Python程序設計
  2.1  Python的安裝與運行
    2.1.1  Python的特點
    2.1.2  Python的下載與安裝
    2.1.3  Python程序的運行
    2.1.4  第三方軟體包的安裝
    2.1.5  Python編程規範
  2.2  數據類型與運算符
    2.2.1  數字和字元串
    2.2.2  列表和元組
    2.2.3  字典和集合
    2.2.4  運算符
  2.3  程序控制結構
    2.3.1  程序流程圖
    2.3.2  順序結構
    2.3.3  選擇結構
    2.3.4  循環結構
  2.4  函數與模塊
    2.4.1  函數的使用
    2.4.2  函數的參數傳遞
    2.4.3  全局變數與局部變數
    2.4.4  匿名函數
    2.4.5  模塊
  2.5  文件
    2.5.1  文件的打開與關閉
    2.5.2  文件的讀取與寫入

    2.5.3  文件的定位
  2.6  本章小結
  2.7  習題
第3章  大數據採集
  3.1  大數據採集概述
    3.1.1  大數據採集的概念
    3.1.2  大數據採集的數據源
    3.1.3  大數據採集方法
    3.1.4  大數據採集平台
  3.2  網路爬蟲技術
    3.2.1  網路爬蟲概述
    3.2.2  常用網路爬蟲方法
    3.2.3  網頁數據採集的實現
    3.2.4  常用網路爬蟲工具
    3.2.5  電影評論爬取
  3.3  數據抽取技術
    3.3.1  數據抽取概述
    3.3.2  Kettle簡介與其安裝
    3.3.3  文本數據抽取
    3.3.4  網頁數據抽取
  3.4  案例:網路租房信息採集
    3.4.1  網路爬蟲採集數據
    3.4.2  抽取租房信息
  3.5  本章小結
  3.6  習題
第4章  大數據預處理技術
  4.1  數據預處理概述
    4.1.1  數據質量
    4.1.2  數據預處理的主要任務
  4.2  數據清洗
    4.2.1  缺失值處理方法
    4.2.2  雜訊數據處理方法
    4.2.3  冗餘數據處理方法
    4.2.4  數據格式與內容處理方法
  4.3  數據集成
    4.3.1  實體識別問題
    4.3.2  冗余問題
    4.3.3  數據值衝突的檢測與處理
  4.4  數據變換
    4.4.1  數據規範化
    4.4.2  通過離散化變換數據
  4.5  數據歸約
    4.5.1  過濾法
    4.5.2  包裝法
    4.5.3  嵌入法
  4.6  數據脫敏
    4.6.1  數據脫敏類型
    4.6.2  數據脫敏方法
  4.7  案例:汽車行駛工況數據預處理
    4.7.1  案例背景

    4.7.2  數據描述
    4.7.3  數據預處理
  4.8  本章小結
  4.9  習題
第5章  Excel數據獲取與預處理
  5.1  Excel數據獲取
    5.1.1  獲取文本數據
    5.1.2  獲取網站數據
    5.1.3  獲取資料庫中的數據
  5.2  Excel數據清洗與轉換
    5.2.1  常用數據分析函數
    5.2.2  刪除重複行
    5.2.3  文本查找與替換
    5.2.4  字元串截取
    5.2.5  數據的轉置
    5.2.6  數據的查詢和引用
    5.2.7  字母與數字的轉換
  5.3  Excel數據抽取與合併
    5.3.1  值的抽取
    5.3.2  數據合併
    5.3.3  欄位合併
  5.4  案例:房價行情的對比分析
    5.4.1  數據獲取
    5.4.2  數據預處理與分析
  5.5  本章小結
  5.6  習題
第6章  Python數據預處理
  6.1  Python數據預處理基礎
    6.1.1  科學計算庫NumPy
    6.1.2  數據分析庫pandas
  6.2  數據的分組、分割、合併和變形
    6.2.1  數據分組
    6.2.2  數據分割
    6.2.3  數據合併
    6.2.4  數據變形
  6.3  缺失值、異常值和重複值處理
    6.3.1  缺失值處理
    6.3.2  異常值處理
    6.3.3  重複值處理
  6.4  時間序列數據處理
    6.4.1  時間序列的基本操作
    6.4.2  固定頻率的時間序列
    6.4.3  時間周期及其計算
  6.5  文本數據分析
    6.5.1  字元串處理方法
    6.5.2  文本數據分析工具
    6.5.3  正則表達式
    6.5.4  文本預處理
  6.6  案例:IMDb5000電影數據預處理
    6.6.1  數據分析及代碼實現

    6.6.2  完整代碼
  6.7  本章小結
  6.8  習題
第7章  數據可視化技術
  7.1  數據可視化概述
    7.1.1  數據可視化的定義
    7.1.2  數據可視化的發展歷程
    7.1.3  數據可視化的作用
  7.2  數據可視化的理論基礎
    7.2.1  數據可視化的流程
    7.2.2  數據可視化的設計要素
    7.2.3  數據可視化的基礎圖表
    7.2.4  數據可視化的常見工具
  7.3  Python數據可視化方法
    7.3.1  Matplotlib繪製基礎圖表
    7.3.2  seaborn繪製統計圖
    7.3.3  wordcloud繪製詞雲圖
    7.3.4  NetworkX繪製網路圖
    7.3.5  案例:重慶公開庭審數據可視化
  7.4  pyecharts數據可視化方法
    7.4.1  pyecharts簡介
    7.4.2  pyecharts應用
    7.4.3  案例:2020年東京奧運會獎牌看板
  7.5  本章小結
  7.6  習題
參考文獻

  • 商品搜索:
  • | 高級搜索
首頁新手上路客服中心關於我們聯絡我們Top↑
Copyrightc 1999~2008 美商天龍國際圖書股份有限公司 臺灣分公司. All rights reserved.
營業地址:臺北市中正區重慶南路一段103號1F 105號1F-2F
讀者服務部電話:02-2381-2033 02-2381-1863 時間:週一-週五 10:00-17:00
 服務信箱:bookuu@69book.com 客戶、意見信箱:cs@69book.com
ICP證:浙B2-20060032