幫助中心 | 我的帳號 | 關於我們

數據採集與處理(基於Python新編21世紀數據科學與大數據技術系列教材)

  • 作者:編者:付東普|責編:王美玲//陳怡梅
  • 出版社:中國人民大學
  • ISBN:9787300325682
  • 出版日期:2024/04/01
  • 裝幀:平裝
  • 頁數:273
人民幣:RMB 39 元      售價:
放入購物車
加入收藏夾

內容大鋼
    本書從Python語言的基本特性入手,詳細介紹了各類數據編碼和存取技術、網路爬蟲相關技術、數據預處理和數據可視化技術等,內容覆蓋本地文件、網路數據、大數據訪問及數據預處理等編程中的主要知識和技術,在重視理論基礎的前提下,從實用性和豐富度出發,結合實例演示了數據採集、處理與存儲的核心流程。
    本書可作為高等院校數據科學與大數據技術、電腦科學與技術、軟體工程等專業的本科教材,也適合Python語言初學者、網路爬蟲技術愛好者、數據分析從業人士閱讀。

作者介紹
編者:付東普|責編:王美玲//陳怡梅
    付東普,管理學博士,產業經濟學博士后,首都經濟貿易大學信息學院副教授,主要關注互聯網金融及電子商務領域研究。     1992-1996年就讀於合肥工業大學材料科學與工程系,獲本科工學學士學位;2005-2007年就讀於北京理工大學軟體學院,獲軟體工程碩士學位;2011-2014年就讀於中國人民大學商學院,獲管理學博士學位;2015-2017年在北京交通大學中國產業安全研究中心博士后科研工作站從事應用經濟學博士后研究。     曾從事十余年的軟體系統設計、開發和管理工作,後於2011年轉入學術理論研究,在國內外學術會議和期刊上發表了二十余篇學術論文,並出版專著兩部。

目錄
第一章  概述
  第一節  數據科學概述
  第二節  數據採集概述
  第三節  數據存儲概述
  第四節  Python相關數據科學工具
  思考與練習
  延伸閱讀材料
第二章  Python基礎
  第一節  Python簡介
  第二節  Python基本語法與命令
  第三節  運算符、表達式與內置對象
  第四節  函數
  第五節  異常及其處理
  思考與練習
  延伸閱讀材料
第三章  numpy與pandas基礎
  第一節  numpy基礎
  第二節  pandas基礎
  思考與練習
  延伸閱讀材料
第四章  數據可視化
  第一節  數據可視化概述
  第二節  matplotlib繪圖工具
  第三節  其他數據可視化工具
  思考與練習
  延伸閱讀材料
第五章  文件讀寫與操作
  第一節  文件讀寫基本操作
  第二節  CSV文件讀寫
  第三節  XML文件讀寫
  第四節  JSON文件讀寫
  第五節  HDF文件讀寫
  第六節  Office文件讀寫
  第七節  PDF文件讀寫
  第八節  圖像文件讀寫
  思考與練習
  延伸閱讀材料
第六章  統計與概率基礎
  第一節  統計基礎
  第二節  概率與分佈
  思考與練習
  延伸閱讀材料
第七章  數據清洗與預處理
  第一節  數據清洗
  第二節  數據整合
  第三節  數據變換
  第四節  聚合與分組統計
  第五節  數據歸約
  思考與練習
  延伸閱讀材料

第八章  網路數據採集
  第一節  爬蟲的相關概念與知識
  第二節  HTML與基礎
  第三節  靜態網頁內容爬取與解析
  第四節  動態網頁內容爬取
  第五節  爬蟲框架Scrapy與應用
  思考與練習
  延伸閱讀材料
第九章  關係型資料庫連接與訪問
  第一節  關係型資料庫概述
  第二節  SQLite資料庫連接與訪問
  第三節  MySQL資料庫連接與訪問
  思考與練習
  延伸閱讀材料
第十章  大數據存儲與訪問技術
  第一節  大數據技術
  第二節  非關係型資料庫簡介
  第三節  MongoDB資料庫連接與訪問
  思考與練習
  延伸閱讀材料
第十一章  數據集成與ETL技術
  第一節  數據集成
  第二節  ETL相關技術與工具
  思考與練習
  延伸閱讀材料
參考文獻

  • 商品搜索:
  • | 高級搜索
首頁新手上路客服中心關於我們聯絡我們Top↑
Copyrightc 1999~2008 美商天龍國際圖書股份有限公司 臺灣分公司. All rights reserved.
營業地址:臺北市中正區重慶南路一段103號1F 105號1F-2F
讀者服務部電話:02-2381-2033 02-2381-1863 時間:週一-週五 10:00-17:00
 服務信箱:bookuu@69book.com 客戶、意見信箱:cs@69book.com
ICP證:浙B2-20060032