幫助中心 | 我的帳號 | 關於我們

大數據分析(Python爬蟲數據清洗和數據可視化第2版微課視頻版)/大數據與人工智慧技術叢書

  • 作者:編者:黃源//蔣文豪//龍穎|責編:王冰飛
  • 出版社:清華大學
  • ISBN:9787302605232
  • 出版日期:2022/09/01
  • 裝幀:平裝
  • 頁數:339
人民幣:RMB 59.8 元      售價:
放入購物車
加入收藏夾

內容大鋼
    本書的編寫目的是向讀者介紹大數據分析的基本概念和相應的技術應用。全書共10章,分別介紹大數據概述、爬蟲和大數據相關技術、Scrapy爬蟲、Python與MySQL資料庫連接與查詢、數據可視化基礎與應用、大數據存儲與清洗、數據格式與編碼技術、數據抽取與採集、pandas數據分析與清洗以及綜合實訓,本書將理論與實踐操作相結合,通過大量的案例幫助讀者快速了解和應用大數據分析相關技術,並對書中重要的、核心的知識點加大練習的比例,以達到熟練應用的目的。
    本書可作為高等院校大數據專業、人工智慧專業、軟體技術專業、雲計算專業、電腦網路專業的專業課教材,也可作為大數據愛好者的參考書。

作者介紹
編者:黃源//蔣文豪//龍穎|責編:王冰飛

目錄
第1章  大數據
  1.1  大數據概述
    1.1.1  大數據介紹
    1.1.2  大數據的特徵
    1.1.3  大數據技術基礎
    1.1.4  大數據應用
  1.2  大數據的意義
    1.2.1  大數據的國家戰略意義
    1.2.2  大數據的企業意義
    1.2.3  我國大數據市場的預測
  1.3  大數據的產業鏈分析
    1.3.1  技術分析
    1.3.2  運營分析
  1.4  本章小結
  1.5  實訓e
  習題
第2章  爬蟲與大數據
  2.1  爬蟲概述
    2.1.1  爬蟲介紹
    2.1.2  爬蟲的地位與作用
  2.2  Python介紹
    2.2.1  Python開發環境的搭建
    2.2.2  編寫Python程序
    2.2.3  Python數據類型
  2.3  爬蟲相關知識
    2.3.1  了解網頁結構
    2.3.2  Python與爬蟲
    2.3.3  基礎爬蟲框架
    2.3.4  正則表達式
  2.4  利用爬蟲抓取網頁內容
    2.4.1  觀察與分析頁面
    2.4.2  抓取過程分析
    2.4.3  獲取頁面內容
  2.5  本章小結
  2.6  實訓
  習題
第3章  Scrapy爬蟲
  3.1  Scrapy爬蟲概述9
  3.2  Scrapy原理
    3.2.1  Scrapy框架的架構
    3.2.2  Request對象和Response對象
    3.2.3  Select對象
    3.2.4  Spider開發流程
  3.3  Scrapy的開發與實現
    3.3.1  Scrapy爬蟲的開發流程
    3.3.2  創建Scrapy項目並查看結構
    3.3.3  編寫代碼並運行爬蟲
  3.4  本章小結
  3.5  實訓
  習題

第4章  資料庫連接與查詢
  4.1  資料庫
    4.1.1  資料庫概述
    4.1.2  關係資料庫設計
  4.2  MySQL資料庫
    4.2.1  MySQL資料庫概述
    4.2.2  MySQL資料庫的下載、安裝與運行
    4.2.3  MySQL資料庫命令行入門
  4.3  使用Python操作MySQL資料庫
    4.3.1  pymysql的安裝與使用
    4.3.2  使用Python連接MySQL資料庫
  4.4  本章小結
  4.5  實訓
  習題
第5章  數據可視化基礎與應用
  5.1  數據可視化
    5.1.1  數據可視化概述
    5.1.2  數據可視化工具
    5.1.3  數據可視化圖表
  5.2  matplotlib可視化基礎
    5.2.1  numpy庫
    5.2.2  matplotlib的認識與安裝
    5.2.3  matplotlib測試
    5.2.4  matplotlib.pyplot庫
  5.3  matplotlib可視化繪圖
    5.3.1  繪製線性圖形
    5.3.2  繪製柱狀圖
    5.3.3  繪製直方圖
    5.3.4  繪製散點圖
    5.3.5  繪製極坐標圖
    5.3.6  繪製餅圖
  5.4  pyecharts可視化應用
  5.5  本章小結
  5.6  實訓
  習題
第6章  大數據存儲與清洗
  6.1  大數據存儲
  6.2  數據清洗
    6.2.1  數據清洗概述
    6.2.2  數據清洗的原理
    6.2.3  數據清洗的流程
    6.2.4  數據清洗的工具
  6.3  數據標準化
    6.3.1  數據標準化的概念
    6.3.2  數據標準化的方法
    6.3.3  數據標準化的實例
  6.4  本章小結
  6.5  實訓
  習題
第7章  數據格式與編碼技術

  7.1  文件格式
  7.2  數據類型與編碼
    7.2.1  數據類型概述
    7.2.2  字元編碼
    7.2.3  數據轉換
  7.3  Kettle數據清洗與轉換工具的使用
    7.3.1  Kettle概述
    7.3.2  Kettle的安裝與使用
  7.4  CSV格式的數據轉換
    7.4.1  CSV格式概述
    7.4.2  CSV與JSON文件的轉換
  7.5  本章小結
  7.6  實訓
  習題
第8章  數據抽取與採集
  8.1  數據抽取
  8.2  文本抽取與實現
    8.2.1  文本文件的抽取
    8.2.2  CSV文件的抽取
    8.2.3  JSON文件的抽取
  8.3  網頁數據抽取與實現
    8.3.1  網頁數據抽取
    8.3.2  Excel抽取網頁數據
    8.3.3  Kettle抽取網頁數據
  8.4  數據採集與實現
  8.5  本章小結
  8.6  實訓
  習題
第9章  pandas數據分析與清洗
  9.1  認識pandas
  9.2  pandas的語法與使用
  9.3  pandas讀取與清洗數據
    9.3.1  數據準備
    9.3.2  從CSV中讀取數據
    9.3.3  pandas數據清洗
  9.4  pandas數據可視化
    9.4.1  pandas繪圖概述
    9.4.2  pandas繪圖方法
  9.5  本章小結
  9.6  實訓
  習題
第10章  綜合實訓
  10.1  數據清洗實訓
    10.1.1  使用Kettle對生成的隨機數實現欄位選擇
    10.1.2  使用Kettle連接不同的數據表
    10.1.3  使用Kettle過濾數據表
    10.1.4  使用Kettle連接MySQL資料庫並輸出查詢結果
  10.2  數據分析實訓
  10.3  本章小結
  習題

參考文獻

  • 商品搜索:
  • | 高級搜索
首頁新手上路客服中心關於我們聯絡我們Top↑
Copyrightc 1999~2008 美商天龍國際圖書股份有限公司 臺灣分公司. All rights reserved.
營業地址:臺北市中正區重慶南路一段103號1F 105號1F-2F
讀者服務部電話:02-2381-2033 02-2381-1863 時間:週一-週五 10:00-17:00
 服務信箱:bookuu@69book.com 客戶、意見信箱:cs@69book.com
ICP證:浙B2-20060032