幫助中心 | 我的帳號 | 關於我們

Python數據科學實戰

  • 作者:(俄羅斯)尤利·瓦西列夫|責編:謝曉芳|譯者:林炳清
  • 出版社:人民郵電
  • ISBN:9787115620675
  • 出版日期:2024/01/01
  • 裝幀:平裝
  • 頁數:180
人民幣:RMB 69.8 元      售價:
放入購物車
加入收藏夾

內容大鋼
    本書主要從實戰角度講述了如何處理、分析和可視化數據,如何用數據建立各種統計學或機器學習模型。本書首先介紹如何使用Python代碼獲取、轉換和分析數據;接著講述如何使用Python中的數據結構和第三方庫;然後展示如何以各種格式載入數據,如何對數據進行分組與匯總,如何創建圖表和可視化數據;最後討論如何解決實際的問題。
    本書適合希望使用Python處理和分析數據的開發人員閱讀,也可供電腦相關專業的師生參考。

作者介紹
(俄羅斯)尤利·瓦西列夫|責編:謝曉芳|譯者:林炳清
    尤利·瓦西列夫(Yuli Vasiliev)是一名程序員、作家,精通數據結構和資料庫後端開發。他是Natural Language Processing with Python and spaCy一書的作者。

目錄
第1章  數據的基礎知識
  1.1  數據類別
    1.1.1  非結構化數據
    1.1.2  結構化數據
    1.1.3  半結構化數據
    1.1.4  時間序列數據
  1.2  數據來源
    1.2.1  API
    1.2.2  網頁
    1.2.3  數據框
    1.2.4  文件
  1.3  數據處理流程
    1.3.1  數據獲取
    1.3.2  數據清洗
    1.3.3  數據變換
    1.3.4  數據分析
    1.3.5  數據存儲
  1.4  Python特有的方式
  1.5  總結
第2章  Python數據結構
  2.1  列表
    2.1.1  創建列表
    2.1.2  使用常見列表對象方法
    2.1.3  使用切片符號
    2.1.4  用列表實現隊列
    2.1.5  用列表實現棧
    2.1.6  用列表和棧進行自然語言處理
    2.1.7  使用列表推導式改進演算法
  2.2  元組
    2.2.1  元組列表
    2.2.2  不變性
  2.3  字典
    2.3.1  字典列表
    2.3.2  使用setdefault()在字典中添加元素
    2.3.3  將JSON文件載入到字典中
  2.4  集合
    2.4.1  從序列中刪除重複項
    2.4.2  實現常見集合運算
  2.5  總結
第3章  Python第三方庫
  3.1  NumPy庫
    3.1.1  安裝NumPy庫
    3.1.2  創建NumPy數組
    3.1.3  逐點運算
    3.1.4  使用NumPy統計函數
  3.2  pandas庫
    3.2.1  安裝pandas庫
    3.2.2  序列
    3.2.3  數據框
  3.3  scikit-learn庫

    3.3.1  安裝scikit-learn庫
    3.3.2  獲得樣本數據
    3.3.3  把樣本數據載入數據框
    3.3.4  把數據分成訓練數據集和測試數據集
    3.3.5  把文本轉化為數值特徵向量
    3.3.6  訓練和評估模型
    3.3.7  在新數據中做預測
  3.4  總結
第4章  從文件和API訪問數據
  4.1  使用Python函數open()導入數據
    4.1.1  文本文件
    4.1.2  表格數據文件
    4.1.3  二進位文件
  4.2  將數據導出到文件
  4.3  訪問遠程文件和API
    4.3.1  HTTP請求的工作原理
    4.3.2  urllib3庫
    4.3.3  Requests庫
  4.4  將數據移入或移出數據框
    4.4.1  導入嵌套的JSON結構
    4.4.2  將數據框轉換為JSON文檔
    4.4.3  使用pandas-datareader庫將在線數據載入到數據框中
  4.5  總結
第5章  使用資料庫
  5.1  關係資料庫
    5.1.1  了解SQL語句
    5.1.2  MySQL入門
    5.1.3  定義資料庫結構
    5.1.4  將數據插入資料庫中
    5.1.5  查詢資料庫數據
    5.1.6  使用資料庫分析工具
  5.2  NoSQL資料庫
    5.2.1  Redis資料庫
    5.2.2  MongoDB資料庫
  5.3  總結
第6章  聚合數據
  6.1  要聚合的數據
  6.2  合併數據框
  6.3  分組和聚合數據
    6.3.1  按多索引查看特定值
    6.3.2  通過切片獲得一系列值
    6.3.3  多索引多層次切片
    6.3.4  添加總計
    6.3.5  添加小計
  6.4  選擇組中的所有行
  6.5  總結
第7章  合併數據
  7.1  合併Python數據結構
    7.1.1  使用「+」合併列表和元組
    7.1.2  使用「**」合併字典

    7.1.3  合併兩個結構的對應行
    7.1.4  列表的多種合併方式
  7.2  合併NumPy數組
  7.3  合併pandas數據結構
    7.3.1  連接數據框
    7.3.2  合併兩個數據框
  7.4  總結
第8章  數據可視化
  8.1  常見可視化形式
    8.1.1  折線圖
    8.1.2  柱狀圖
    8.1.3  餅狀圖
    8.1.4  直方圖
  8.2  使用Matplotlib庫繪製圖
    8.2.1  安裝Matplotlib庫
    8.2.2  使用matplotlib.pyplot
    8.2.3  使用Figure和Axes對象
  8.3  總結
第9章  分析空間數據
  9.1  獲取空間數據
    9.1.1  將人可讀的地址轉換為地理坐標
    9.1.2  獲取移動對象的地理坐標
  9.2  基於geopy庫和Shapely庫的空間數據分析
    9.2.1  查找最近的對象
    9.2.2  在特定區域中查找對象
    9.2.3  結合兩種方法
  9.3  結合空間數據和非空間數據
    9.3.1  提取非空間屬性
    9.3.2  合併空間數據集和非空間數據集
  9.4  總結
第10章  分析時間序列數據
  10.1  規則時間序列與不規則時間序列
  10.2  常見的時間序列分析技術
    10.2.1  計算百分比變化
    10.2.2  滾動窗口計算
    10.2.3  計算滾動平均值的百分比變化
  10.3  多元時間序列
    10.3.1  處理多元時間序列
    10.3.2  分析變數之間的依賴性
  10.4  總結
第11章  從數據中挖掘信息
  11.1  關聯法則
    11.1.1  支持度
    11.1.2  置信度
    11.1.3  提升度
  11.2  Apriori演算法
    11.2.1  創建交易數據集
    11.2.2  識別頻繁項集
    11.2.3  生成關聯規則
  11.3  可視化關聯規則

  11.4  從關聯規則獲得可操作信息
    11.4.1  生成推薦信息
    11.4.2  基於關聯規則的折扣規劃
  11.5  總結
第12章  數據分析的機器學習
  12.1  為什麼選擇機器學習
  12.2  機器學習的類型
    12.2.1  有監督學習
    12.2.2  無監督學習
  12.3  機器學習的工作原理
    12.3.1  訓練數據
    12.3.2  統計模型
    12.3.3  預測數據
  12.4  情感分析示例:產品評論分類
    12.4.1  獲取產品評論
    12.4.2  清理數據
    12.4.3  拆分和轉換數據
    12.4.4  訓練模型
    12.4.5  評估模型
  12.5  預測股票走勢
    12.5.1  獲取數據
    12.5.2  從連續數據中提取特徵
    12.5.3  生成輸出變數
    12.5.4  訓練和評估模型
  12.6  總結

  • 商品搜索:
  • | 高級搜索
首頁新手上路客服中心關於我們聯絡我們Top↑
Copyrightc 1999~2008 美商天龍國際圖書股份有限公司 臺灣分公司. All rights reserved.
營業地址:臺北市中正區重慶南路一段103號1F 105號1F-2F
讀者服務部電話:02-2381-2033 02-2381-1863 時間:週一-週五 10:00-17:00
 服務信箱:bookuu@69book.com 客戶、意見信箱:cs@69book.com
ICP證:浙B2-20060032