幫助中心 | 我的帳號 | 關於我們

海量數據採集與處理(普通高等教育數據科學與大數據技術專業十三五規劃教材)

  • 作者:編者:江成//葉堂林//張京|責編:曉地
  • 出版社:首都經貿
  • ISBN:9787563838493
  • 出版日期:2025/03/01
  • 裝幀:平裝
  • 頁數:187
人民幣:RMB 33 元      售價:
放入購物車
加入收藏夾

內容大鋼
    本書以Python作為主要工具,著重講解海量數據採集與處理相關內容。力求通過由淺入深、先理論基礎后實踐應用的思路,培養學生應用Python解決實際問題的能力。全書內容分為上、下篇共9章。上篇主要介紹數據採集的基本概念、Python開發環境、數據採集常用的兩種框架Numpy和Pandas的使用;下篇對數據採集原理、爬蟲基礎庫的使用、頁面採集框架的使用、數據的存儲與使用、數據的清洗與預處理,以及綜合實例的應用進行介紹。本書在內容編寫與安排上盡量做到結構合理、邏輯嚴謹,可供信息管理與信息系統、大數據、電腦、人工智慧等相關專業的學生使用;亦可供經濟管理類其他專業學生入門參考,用於交叉方向的科學研究。

作者介紹
編者:江成//葉堂林//張京|責編:曉地

目錄
上篇  數據採集基礎
  1  數據的採集與處理概述
    1.1  大數據技術概述
    1.2  數據採集概述
    1.3  數據處理技術概述
    1.4  Python數據採集和處理技術
    本章習題
  2  Python數據採集與處理環境
    2.1  Python的安裝
    2.2  集成開發器環境(IDE)介紹
    2.3  請求庫的安裝
    2.4  Web庫的安裝
    2.5  資料庫的安裝
    2.6  擴展庫
    2.7  Python基本語法
    本章習題
  3  Numpy框架的使用
    3.1  Numpy簡介
    3.2  Numpy框架使用簡介
    3.3  數組的創建
    3.4  數組的運算
    3.5  隨機數的操作
    3.6  統計函數分析
    本章習題
  4  Pandas庫的使用
    4.1  Pandas簡介
    4.2  Pandas基本數據結構
    4.3  Pandas基本功能介紹
    4.4  Pandas分類類型
    4.5  GroupBy高級應用
    4.6  鏈式編程技術
    本章習題
下篇  數據採集實戰應用
  5  基於Python的爬蟲基礎類庫的使用
    5.1  數據採集知識體系介紹
    5.2  Python requests庫的基本使用
    5.3  Python Urllib庫的基本使用
    5.4  正則表達式的使用
    5.5  XML文件的解析
    5.6  多線程數據採集
    本章習題
  6  頁面採集框架的使用
    6.1  Scrapy框架與Spider類
    6.2  Scrapy與CrawlSpider類
    6.3  Selenium框架與Webdriver庫
    6.4  Splash框架與API
    本章習題
  7  數據的存儲與使用
    7.1  數據存取基本文件介紹
    7.2  關係型資料庫和非關係型資料庫

    7.3  PyMySQL基本功能和使用操作
    7.4  PyMongoDB基本功能和使用
    7.5  Redis-py基本功能和使用操作
    本章習題
  8  數據清洗和預處理
    8.1  數據編碼問題
    8.2  數據的清洗
    8.3  數據的預處理
    8.4  數據類型轉換操作
    8.5  字元串的操作
    8.6  時序數據處理
    8.7  分類字元串數據的量化處理
    本章習題
  9  綜合案例
    9.1  金融新聞數據的採集與處理
    9.2  獲取新浪財經數據
    本章習題

  • 商品搜索:
  • | 高級搜索
首頁新手上路客服中心關於我們聯絡我們Top↑
Copyrightc 1999~2008 美商天龍國際圖書股份有限公司 臺灣分公司. All rights reserved.
營業地址:臺北市中正區重慶南路一段103號1F 105號1F-2F
讀者服務部電話:02-2381-2033 02-2381-1863 時間:週一-週五 10:00-17:00
 服務信箱:bookuu@69book.com 客戶、意見信箱:cs@69book.com
ICP證:浙B2-20060032