幫助中心 | 我的帳號 | 關於我們

數據科學導論(Python語言原書第3版)/數據科學與工程技術叢書

  • 作者:(意)阿爾貝托·博斯凱蒂//盧卡·馬薩羅|責編:羅丹琪|譯者:于俊偉
  • 出版社:機械工業
  • ISBN:9787111646693
  • 出版日期:2020/03/01
  • 裝幀:平裝
  • 頁數:283
人民幣:RMB 79 元      售價:
放入購物車
加入收藏夾

內容大鋼
    本書是作者多年數據科學實踐經驗的總結,第3版通過對上一版內容的更新和擴展,以新版的Jupyter Notebook和Jupyter Lab界面為基礎,涵蓋Numpy、pandas和Scikit-learn等庫的所有主要更新,全面又系統地講解了數據科學分析和開發的相關工具、最佳實踐以及簡單示例。通過閱讀本書,你將深入了解Python核心概念,成為高效數據科學實踐者。
    本書共8章,第1章介紹Jupyter Notebook的使用方法;第2章介紹所有關鍵的數據操作和轉換技術,重點介紹數據改寫的最佳實踐;第3章討論有可能改進數據科學項目結果的數據操作技術;第4章深入研究Scikit-learn中的主要機器學習演算法;第5章介紹基礎和中高級圖形表示技術;第6章介紹一些實用且有效的社交關係和交互數據處理技術;第7章深入介紹深度學習原理,結合Keras庫便捷地搭建各種深度學習網路,並通過示例演示深度學習在交通標誌分類和電影評論情感預測中的應用;第8章介紹一種處理數據的新方法——水平縮放大數據。附錄則是一些Python示例和說明,重點介紹Python語言的主要特點。

作者介紹
(意)阿爾貝托·博斯凱蒂//盧卡·馬薩羅|責編:羅丹琪|譯者:于俊偉

目錄
譯者序
前言
作者簡介
審閱者簡介
第1章  新手上路
  1.1  數據科學與Python簡介
  1.2  Python的安裝
    1.2.1  Python 2還是Python
    1.2.2  分步安裝
    1.2.3  安裝必要的工具包
    1.2.4  工具包升級
  1.3  科學計算髮行版
    1.3.1  Anaconda
    1.3.2  使用conda安裝工具包
    1.3.3  Enthought Canopy
    1.3.4  WinPython
  1.4  虛擬環境
  1.5  核心工具包一瞥
  1.6  Jupyter簡介
    1.6.1  快速安裝與初次使用
    1.6.2  Jupyter魔術命令
    1.6.3  直接從Jupyter Notebook安裝軟體包
    1.6.4  查看新的JupyterLab環境
    1.6.5  Jupyter Notebook怎樣幫助數據科學家
    1.6.6  Jupyter的替代版本
  1.7  本書使用的數據集和代碼
    1.7.1  Scikit-learn小規模數據集
    1.7.2  MLdata.org和其他公共資源庫
    1.7.3  LIBSVM Data樣本
    1.7.4  直接從CSV或文本文件載入數據
    1.7.5  Scikit-learn樣本生成器
  1.8  小結
第2章  數據改寫
  2.1  數據科學過程
  2.2  使用pandas進行數據載入與預處理
    2.2.1  數據快捷載入
    2.2.2  處理問題數據
    2.2.3  處理大數據集
    2.2.4  訪問其他的數據格式
    2.2.5  合併數據
    2.2.6  數據預處理
    2.2.7  數據選擇
  2.3  使用分類數據和文本數據
    2.3.1  特殊的數據類型—文本
    2.3.2  使用Beautiful Soup抓取網頁
  2.4  使用Numpy進行數據處理
    2.4.1  NmuPy中的N維數組
    2.4.2  NmuPy ndarray對象基礎
  2.5  創建Numpy數組
    2.5.1  從列表到一維數組

    2.5.2  控制內存大小
    2.5.3  異構列表
    2.5.4  從列表到多維數組
    2.5.5  改變數組大小
    2.5.6  利用NumPy函數生成數組
    2.5.7  直接從文件中獲得數組
    2.5.8  從pandas提取數據
  2.6  NumPy快速操作和計算
    2.6.1  矩陣運算
    2.6.2  NumPy數組切片和索引
    2.6.3  NumPy數組堆疊
    2.6.4  使用稀疏數組
  2.7  小結
第3章  數據科學流程
  3.1  EDA簡介
  3.2  創建新特徵
  3.3  維數約簡
    3.3.1  協方差矩陣
    3.3.2  主成分分析
    3.3.3  一種用於大數據的PCA變型—RandomizedPCA
    3.3.4  潛在因素分析
    3.3.5  線性判別分析
    3.3.6  潛在語義分析
    3.3.7  獨立成分分析
    3.3.8  核主成分分析
    3.3.9  T-分佈鄰域嵌入演算法
    3.3.10  受限波爾茲曼機
  3.4  異常檢測和處理
    3.4.1  單變數異常檢測
    3.4.2  EllipticEnvelope
    3.4.3  OneClassSVM
  3.5  驗證指標
    3.5.1  多標號分類
    3.5.2  二值分類
    3.5.3  回歸
  3.6  測試和驗證
  3.7  交叉驗證
    3.7.1  使用交叉驗證迭代器
    3.7.2  採樣和自舉方法
  3.8  超參數優化
    3.8.1  建立自定義評分函數
    3.8.2  減少網格搜索時間
  3.9  特徵選擇
    3.9.1  基於方差的特徵選擇
    3.9.2  單變數選擇
    3.9.3  遞歸消除
    3.9.4  穩定性選擇與基於L1的選擇
  3.10  將所有操作包裝成工作流程
    3.10.1  特徵組合和轉換鏈接
    3.10.2  構建自定義轉換函數

  3.11  小結
第4章  機器學習
  4.1  準備工具和數據集
  4.2  線性和邏輯回歸
  4.3  樸素貝葉斯
  4.4  K近鄰
  4.5  非線性演算法
    4.5.1  基於SVM的分類演算法
    4.5.2  基於SVM的回歸演算法
    4.5.3  調整SVM(優化)
  4.6  組合策略
    4.6.1  基於隨機樣本的粘貼策略
    4.6.2  基於弱分類器的Bagging策略
    4.6.3  隨機子空間和隨機分片
    4.6.4  隨機森林和Extra-Trees
    4.6.5  從組合估計概率
    4.6.6  模型序列—AdaBoost
    4.6.7  梯度樹提升
    4.6.8  XGBoost
    4.6.9  LightGBM
    4.6.10  CatBoost
  4.7  處理大數據
    4.7.1  作為範例創建一些大數據集
    4.7.2  對容量的可擴展性
    4.7.3  保持速度
    4.7.4  處理多樣性
    4.7.5  隨機梯度下降概述
  4.8  自然語言處理一瞥
    4.8.1  詞語分詞
    4.8.2  詞幹提取
    4.8.3  詞性標注
    4.8.4  命名實體識別
    4.8.5  停止詞
    4.8.6  一個完整的數據科學例子—文本分類
  4.9  無監督學習概覽
    4.9.1  K均值演算法
    4.9.2  基於密度的聚類技術—DBSCAN
    4.9.3  隱含狄利克雷分佈
  4.10  小結
第5章  可視化、發現和結果
  5.1  matplotlib基礎介紹
    5.1.1  曲線繪圖
    5.1.2  繪製分塊圖
    5.1.3  數據中的關係散點圖
    5.1.4  直方圖
    5.1.5  柱狀圖
    5.1.6  圖像可視化
    5.1.7  pandas的幾個圖形示例
    5.1.8  通過平行坐標發現模式
  5.2  封裝matplotlib命令

    5.2.1  Seaborn簡介
    5.2.2  增強EDA性能
  5.3  高級數據學習表示
    5.3.1  學習曲線
    5.3.2  確認曲線
    5.3.3  隨機森林的特徵重要性
    5.3.4  GBT部分依賴關係圖形
    5.3.5  創建MA-AAS預測伺服器
  5.4  小結
第6章  社交網路分析
  6.1  圖論簡介
  6.2  圖的演算法
    6.2.1  節點中心性的類型
    6.2.2  網路劃分
  6.3  圖的裝載、輸出和採樣
  6.4  小結
第7章  深度學習進階
第8章  基於Spark的大數據分析
附錄  增強Python基礎

  • 商品搜索:
  • | 高級搜索
首頁新手上路客服中心關於我們聯絡我們Top↑
Copyrightc 1999~2008 美商天龍國際圖書股份有限公司 臺灣分公司. All rights reserved.
營業地址:臺北市中正區重慶南路一段103號1F 105號1F-2F
讀者服務部電話:02-2381-2033 02-2381-1863 時間:週一-週五 10:00-17:00
 服務信箱:bookuu@69book.com 客戶、意見信箱:cs@69book.com
ICP證:浙B2-20060032