幫助中心 | 我的帳號 | 關於我們

Python機器學習及實踐--從零開始通往Kaggle競賽之路(2022年度版)/高等學校創意創新創業教育系列叢書

  • 作者:范淼//徐晟桐|責編:謝琛
  • 出版社:清華大學
  • ISBN:9787302614241
  • 出版日期:2022/10/01
  • 裝幀:平裝
  • 頁數:353
人民幣:RMB 99 元      售價:
放入購物車
加入收藏夾

內容大鋼
    本書在不涉及大量數學模型與複雜編程知識的前提下,從零開始逐步帶領讀者熟悉並掌握當下流行的基於Python 3的數據分析,以及支持單機、深度和分散式機器學習的開源程序庫,如pandas、Scikit-learn、PyTorch、TensorFlow、PaddlePaddle、PySpark-ML等。全書分4部分。入門篇包括對全書核心概念的指南性介紹,以及在多種主流操作系統(Windows、macOS、Ubuntu)上配置基本編程環境的詳細說明。基礎篇涵蓋Python 3的編程基礎、基於pandas的數據分析,以及使用Scikit-learn解決大量經典的單機(單核/多核)機器學習問題。進階篇介紹如何使用PyTorch、TensorFlow、PaddlePaddle搭建多種深度學習網路框架,以及如何基於PySpark的ML編程庫完成一些常見的分散式機器學習任務。實踐篇利用全書所講授的Python編程、數據分析、機器學習知識,幫助讀者挑戰和參與Kaggle多種類型的競賽實戰,同時介紹如何使用Git在Gitee、GitHub平台上維護和管理日常代碼與編程項目。
    本書適合所有對人工智慧領域,特別是機器學習、數據挖掘、自然語言處理等技術及其實踐感興趣的初學者。

作者介紹
范淼//徐晟桐|責編:謝琛

目錄
第1部分  入門篇
  第1章  全書指南
    1.1  Python編程
    1.2  數據分析
    1.3  機器學習
      1.3.1  任務
      1.3.2  經驗
      1.3.3  性能
    1.4  Kaggle競賽
    1.5  Git代碼管理
    1.6  章末小結
  第2章  基本環境搭建與配置
    2.1  Windows操作系統下基本環境的搭建與配置
      2.1.1  查看Windows的版本與原始配置
      2.1.2  下載並安裝Anaconda3(Windows)
      2.1.3  使用Anaconda Navigator創建虛擬環境python_env(Windows)
      2.1.4  在虛擬環境python_env下使用Anaconda Navigator安裝Jupyter Notebook與PyCharm Professional(Windows)
    2.2  macOS操作系統下基本環境的搭建與配置
      2.2.1  查看macOS的版本與原始配置
      2.2.2  下載並安裝Anaconda3(macOS)
      2.2.3  使用Anaconda Navigator創建虛擬環境python_env(macOS)
      2.2.4  在虛擬環境python_env下使用Anaconda Navigator安裝Jupyter Notebook與PyCharm Professional(macOS)
    2.3  Ubuntu操作系統下基本環境的搭建與配置
      2.3.1  查看Ubuntu的版本與原始配置
      2.3.2  下載並安裝Anaconda3(Ubuntu)
      2.3.3  在終端中創建虛擬環境python_env(Ubuntu)
      2.3.4  在虛擬環境python_env下使用conda命令安裝Jupyter Notebook(Ubuntu)
    2.4  Jupyter Notebook使用簡介
      2.4.1  在虛擬環境python_env下啟動Jupyter Notebook
      2.4.2  創建一個.ipynb文件
      2.4.3  試運行.ipynb文件內的Python 3程序
    2.5  PyCharm使用簡介
      2.5.1  在虛擬環境python_env下啟動PyCharm
      2.5.2  基於虛擬環境python_env的Python 3.8解釋器創建一個.py文件
      2.5.3  試運行.py文件內的Python 3程序
    2.6  章末小結
第2部分  基礎篇
  第3章  Python編程基礎
    3.1  Python編程環境配置
      3.1.1  基於命令行/終端的互動式編程環境
      3.1.2  基於Web的互動式開發環境
      3.1.3  集成式開發環境
    3.2  Python基本語法
      3.2.1  賦值
      3.2.2  註釋
      3.2.3  縮進
    3.3  Python數據類型
    3.4  Python數據運算
    3.5  Python流程式控制制
      3.5.1  分支語句

      3.5.2  循環控制
    3.6  Python函數設計
    3.7  Python面向對象編程
    3.8  Python編程庫(包)導入
    3.9  Python編程綜合實踐
    3.10  章末小結
  第4章  pandas數據分析
    4.1  pandas環境配置
      4.1.1  使用Anaconda Navigator搭建和配置環境
      4.1.2  使用conda命令搭建和配置環境
    4.2  pandas核心數據結構
      4.2.1  Series
      4.2.2  DataFrame
    4.3  pandas讀取/寫入文件數據
      4.3.1  讀取/寫入CSV文件數據
      4.3.2  讀取/寫入JSON文件數據
      4.3.3  讀取/寫入Excel文件數據
    4.4  pandas數據分析的常用功能
      4.4.1  添加數據
      4.4.2  刪除數據
      4.4.3  查詢/篩選數據
      4.4.4  修改數據
      4.4.5  數據統計
      4.4.6  數據排序
      4.4.7  函數應用
    4.5  pandas數據合併
    4.6  pandas數據清洗
    4.7  pandas數據分組與聚合
    4.8  章末小結
  第5章  Scikit-learn單機機器學習
    5.1  Scikit-learn環境配置
      5.1.1  使用Anaconda Navigator搭建和配置環境
      5.1.2  使用conda命令搭建和配置環境
    5.2  Scikit-learn無監督學習
      5.2.1  降維學習與可視化
      5.2.2  聚類演算法
    5.3  Scikit-learn監督學習模型
      5.3.1  分類預測
      5.3.2  數值回歸
    5.4  Scikit-learn半監督學習模型
      5.4.1  自學習框架
      5.4.2  標籤傳播演算法
    5.5  單機機器學習模型的常用優化技巧
      5.5.1  交叉驗證
      5.5.2  特徵工程
      5.5.3  參數正則化
      5.5.4  超參數尋優
      5.5.5  並行加速訓練
    5.6  章末小結
第3部分  進階篇

  第6章  PyTorch/TensorFlow/PaddlePaddle深度學習
    6.1  PyTorch/TensorFlow/PaddlePaddle環境配置
    6.2  前饋神經網路
      6.2.1  前饋神經網路的PyTorch實踐
      6.2.2  前饋神經網路的TensorFlow實踐
      6.2.3  前饋神經網路的PaddlePaddle實踐
    6.3  卷積神經網路
      6.3.1  卷積神經網路的PyTorch實踐
      6.3.2  卷積神經網路的TensorFlow實踐
      6.3.3  卷積神經網路的PaddlePaddle實踐
    6.4  循環神經網路
      6.4.1  循環神經網路的PyTorch實踐
      6.4.2  循環神經網路的TensorFlow實踐
      6.4.3  循環神經網路的PaddlePaddle實踐
    6.5  自動編碼器
      6.5.1  自動編碼器的PyTorch實踐
      6.5.2  自動編碼器的TensorFlow實踐
      6.5.3  自動編碼器的PaddlePaddle實踐
    6.6  神經網路模型的常用優化技巧
      6.6.1  隨機失活
      6.6.2  批量標準化
    6.7  章末小結
  第7章  PySpark-ML分散式機器學習
    7.1  PySpark環境配置
      7.1.1  使用Anaconda Navigator搭建和配置環境
      7.1.2  使用conda命令搭建和配置環境
      7.1.3  安裝JRE
    7.2  PySpark分散式數據結構
      7.2.1  RDD
      7.2.2  DataFrame
    7.3  PySpark分散式特徵工程
      7.3.1  特徵抽取
      7.3.2  特徵轉換
    7.4  PySpark-ML分散式機器學習模型
    7.5  分散式機器學習模型的常用優化技巧
      7.5.1  留一驗證
      7.5.2  K-折交叉驗證
    7.6  章末小結
第4部分  實踐篇
  第8章  Kaggle競賽實踐
    8.1  泰坦尼克號罹難乘客預測
      8.1.1  數據分析
      8.1.2  數據預處理
      8.1.3  模型設計與尋優
      8.1.4  提交測試
    8.2  Ames房產價值評估
      8.2.1  數據分析
      8.2.2  數據預處理
      8.2.3  模型設計與尋優
      8.2.4  提交測試

    8.3  推特短文本分類
      8.3.1  數據分析
      8.3.2  數據預處理
      8.3.3  模型設計與尋優
      8.3.4  提交測試
    8.4  CIFAR-100圖像識別
      8.4.1  數據分析
      8.4.2  數據預處理
      8.4.3  模型設計與尋優
      8.4.4  提交測試
    8.5  章末小結
  第9章  Git代碼管理
    9.1  Git本地環境搭建
      9.1.1  Windows下Git工具的安裝與配置
      9.1.2  macOS下Git工具的安裝與配置
      9.1.3  Ubuntu下Git工具的安裝與配置
    9.2  Git遠程倉庫配置
      9.2.1  GitHub介紹
      9.2.2  GitHub遠程倉庫的創建與配置
      9.2.3  Gitee介紹
      9.2.4  Gitee遠程倉庫的創建與配置
    9.3  Git基本指令
      9.3.1  克隆倉庫
      9.3.2  提交修改
      9.3.3  遠程推送
    9.4  Git分支管理
      9.4.1  創建分支
      9.4.2  分支合併
      9.4.3  合併衝突
      9.4.4  刪除分支
    9.5  貢獻Git項目
      9.5.1  Fork項目
      9.5.2  本地克隆、修改與推送
      9.5.3  發起拉取請求
    9.6  章末小結
後記

  • 商品搜索:
  • | 高級搜索
首頁新手上路客服中心關於我們聯絡我們Top↑
Copyrightc 1999~2008 美商天龍國際圖書股份有限公司 臺灣分公司. All rights reserved.
營業地址:臺北市中正區重慶南路一段103號1F 105號1F-2F
讀者服務部電話:02-2381-2033 02-2381-1863 時間:週一-週五 10:00-17:00
 服務信箱:bookuu@69book.com 客戶、意見信箱:cs@69book.com
ICP證:浙B2-20060032