幫助中心 | 我的帳號 | 關於我們

機器學習實踐教程(高等職業教育人工智慧工程技術系列教材)

  • 作者:編者:呂焱飛|責編:潘婭
  • 出版社:電子工業
  • ISBN:9787121469237
  • 出版日期:2024/01/01
  • 裝幀:平裝
  • 頁數:197
人民幣:RMB 43 元      售價:
放入購物車
加入收藏夾

內容大鋼
    機器學習是電腦人工智慧的重要研究領域和應用方向,本書是學習和實踐機器學習的入門教材,基於Python語言,介紹如何使用機器學習的相關演算法對數據進行分析。本書在內容上涵蓋機器學習相關基礎知識,在組織編排上循序漸進。全書共11章,分為3個部分:第一部分(第1?3章)為機器學習基礎知識,包括數值計算基礎、數據分析、數據可視化;第二部分(第4?9章)為機器學習演算法,包括線性模型、樸素貝葉斯、支持向量機、決策樹、聚類分析和集成學習;第三部分(第10?11章)為實踐項目,包括房價預測和手寫數字識別。

作者介紹
編者:呂焱飛|責編:潘婭

目錄
第1章  數值計算基礎
  1.1  Python基礎
    1.1.1  列表與元組
    1.1.2  切片
    1.1.3  列表推導
    1.1.4  生成器表達式
  1.2  NumPy數組
    1.2.1  創建NumPy數組
    1.2.2  數組的屬性
    1.2.3  reshape
    1.2.4  Python列表與NumPy數組
    1.2.5  創建特定數組
    1.2.6  創建單調數組
    1.2.7  生成隨機數
  1.3  NumPy索引
    1.3.1  切片索引
    1.3.2  布爾索引
    1.3.3  更複雜的布爾索引
    1.3.4  整數數組索引
    1.3.5  索引賦值
  1.4  多維索引
    1.4.1  定位單個元素
    1.4.2  多維切片
    1.4.3  newaxis
    1.4.4  Ellipsis
    1.4.5  整數數組索引
  1.5  廣播
    1.5.1  一個實例
    1.5.2  廣播的條件
    1.5.3  如何廣播
    1.5.4  幾個操作實例
    1.5.5  原地修改
  1.6  圖像處理
    1.6.1  導入
    1.6.2  翻轉
    1.6.3  截取下半部分
    1.6.4  縮小
    1.6.5  縱向拉伸
    1.6.6  遮罩
    1.6.7  添加兩條對角線
第2章  數據分析
  2.1  Series
    2.1.1  簡單的Series
    2.1.2  指定索引
    2.1.3  索引的使用
    2.1.4  將Python字典轉換為Series
    2.1.5  自定義索引
    2.1.6  判斷NA值
    2.1.7  索引自動對齊
  2.2  DataFrame

    2.2.1  構建DataFrame
    2.2.2  獲取指定列
    2.2.3  獲取指定行
    2.2.4  對列賦值
    2.2.5  索引對齊
    2.2.6  刪除列
    2.2.7  內部的ndarray
  2.3  數據的選擇
    2.3.1  數據開放平台
    2.3.2  導入數據
    2.3.3  選擇列
    2.3.4  選擇行
    2.3.5  選擇指定區域
    2.3.6  布爾型數組
    2.3.7  多個條件的選擇
    2.3.8  loc與iloc
  2.4  概要與映射
    2.4.1  查看數據頭部
    2.4.2  查看所有的列名
    2.4.3  查看數據概要
    2.4.4  計算數值的頻率
    2.4.5  與平均值的差
    2.4.6  map的用法
    2.4.7  apply的用法
    2.4.8  map與apply的區別
  2.5  分組與排序
    2.5.1  導入數據
    2.5.2  分組統計
    2.5.3  分組最小值
    2.5.4  用lambda函數做分組統計
    2.5.5  更複雜的分組
    2.5.6  同時使用多個聚合函數
    2.5.7  分組后的排序
    2.5.8  區分不同的apply函數
    2.5.9  帶「max」的函數
  2.6  空值
    2.6.1  FIFA數據集
    2.6.2  查看空值的數量
    2.6.3  計算空值的百分比
    2.6.4  清除空值
    2.6.6  清除帶有空值的列
    2.6.6  填充空值
    2.6.7  用平均值來填充空值
    2.6.8  返回值
  2.7  不一致數據的處理
    2.7.1  TheFuzz庫
    2.7.2  數據集
    2.7.3  unique
    2.7.4  清除大寫與空格
    2.7.5  模糊匹配

    2.7.6  欄位替換
第3章  數據可視化
  3.1  Matplotlib基本概念
    3.1.1  導入與設置
    3.1.2  剖析圖形
    3.1.3  兩種風格
  3.2  作圖基礎
    3.2.1  繪製直線
    3.2.2  繪製折線
    3.2.3  格式字元串
    3.2.4  繪製散點圖
    3.2.5  繪製類別數據
    3.2.6  繪製文本
    3.2.7  繪製註解
  3.3  MACD指標分析
    3.3.1  載入貴州茅台股價數據
    3.3.2  收盤價趨勢圖
    3.3.3  計算MACD和signal序列
    3.3.4  繪製MACD指標圖
    3.3.5  金叉與死叉
    3.3.6  計算收益
  3.4  滬深300收益計算
    3.4.1  載入歷史數據
    3.4.2  繪製趨勢圖
    3.4.3  計算收益率
    3.4.4  計算年化收益率
    3.4.5  計算年化波動率
    3.4.6  計算最大回撤率
    3.4.7  計算卡瑪比率
  3.5  日曆策略
    3.5.1  指標計算函數
    3.5.2  只在每月前5日交易的策略
    3.5.3  準備數據
    3.5.4  標記出每月前5日
    3.5.5  計算收益率
    3.5.6  繪製兩條收益曲線
    3.5.7  比較收益指標
    3.5.8  每月后5日的策略
第4章  線性模型
  4.1  機器學習
    4.1.1  傳統軟體與機器學習
    4.1.2  特徵與標籤
    4.1.3  機器學習演算法的分類
    4.1.4  CRISP-DM
  4.2  線性回歸
    4.2.1  模型公式
    4.2.2  scikit-learn
    4.2.3  線性回歸的用法
    4.2.4  線性回歸的參數
    4.2.5  殘差

    4.2.6  均方誤差與平均絕對誤差
    4.2.7  Bootstrap統計方法
  4.3  嶺回歸
    4.3.1  bootstrap函數
    4.3.2  係數分佈
    4.3.3  alpha參數
    4.3.4  最佳alpha參數
  4.4  LASSO回歸
    4.4.1  基本用法
    4.4.2  非零的係數
    4.4.3  最佳alpha參數
    4.4.4  特徵選擇
  4.5  邏輯回歸
    4.5.1  iris數據集
    4.5.2  訓練集與測試集
    4.5.3  LogisticRegression類
    4.5.4  混淆矩陣
    4.5.5  預測的概率
第5章  樸素貝葉斯
  5.1  貝葉斯原理
    5.1.1  患癌的概率
    5.1.2  貝葉斯公式
    5.1.3  樸素貝葉斯
    5.1.4  sklearn中的樸素貝葉斯
  5.2  TF-IDF
    5.2.1  詞項頻率與文檔頻率
    5.2.2  逆文檔頻率
    5.2.3  TF-IDF
    5.2.4  TfidfVectorizer
  5.3  中文文檔分類
    5.3.1  中文分類數據集
    5.3.2  jieba分詞
    5.3.3  載入文本
    5.3.4  停用詞表
    5.3.5  計算TF-IDF權重
    5.3.6  樸素貝葉斯分類器
第6章  支持向量機
  6.1  支持向量
    6.1.1  鳶尾花數據集
    6.1.2  線性SVC
  6.2  特徵縮放
    6.2.1  特殊的數據點
    6.2.2  標準縮放
    6.2.3  Pipeline類
  6.3  多項式特徵
    6.3.1  生成數據集
    6.3.2  添加多項式特徵
    6.3.3  應用實例
  6.4  核函數
    6.4.1  常用核函數

    6.4.2  多項式核函數
    6.4.3  高斯核函數
第7章  決策樹
  7.1  決策樹原理
    7.1.1  熵
    7.1.2  信息增益
    7.1.3  計算實例
    7.1.4  基尼指數
  7.2  DecisionTreeClassifier類
    7.2.1  基本用法
    7.2.2  展示決策樹
  7.3  決策樹調參
    7.3.1  GridSearchCV類
    7.3.2  搜索結果
    7.3.3  最大深度
第8章  聚類分析
  8.1  聚類的基本概念
    8.1.1  距離
    8.1.2  K均值演算法的核心思想
    8.1.3  輪廓係數
  8.2  K均值演算法
    8.2.1  生成數據集
    8.2.2  KMeans類
    8.2.3  樣本點到中心點的距離
    8.2.4  輪廓係數
    8.2.5  最佳中心點個數
第9章  集成學習
  9.1  集成學習原理
    9.1.1  常用架構
    9.1.2  提升法
    9.1.3  裝袋法
    9.1.4  集成方法
  9.2  隨機森林
    9.2.1  糖尿病數據集
    9.2.2  分層抽樣
    9.2.3  RandomForestRegressor
    9.2.4  特徵重要性
  9.3  BaggingRegressor
    9.3.1  基本用法
    9.3.2  參數說明
    9.3.3  搜索最佳參數
    9.3.4  最佳參數的效果
  9.4  梯度提升決策樹
    9.4.1  房價數據集
    9.4.2  初始參數集
    9.4.3  最佳參數
    9.4.4  最佳模型
    9.4.5  增加預估器數量
第10章  房價預測
  10.1  探索數據

    10.1.1  載入數據
    10.1.2  查看空值
    10.1.3  屬性的直方圖
    10.1.4  對收入中位數進行分組
    10.1.5  分組統計
    10.1.6  分層抽樣
  10.2  數據可視化與相關性
    10.2.1  根據地理位置展示數據
    10.2.2  相關關係
    10.2.3  相關係數
    10.2.4  3個新屬性
  10.3  空值的處理
    10.3.1  列出有NaN的行
    10.3.2  處理NaN
    10.3.3  SimpleImputer類
  10.4  文本屬性與流式處理
    10.4.1  文本屬性
    10.4.2  OrdinalEncoder轉換器
    10.4.3  OneHotEncoder類
    10.4.4  流式處理
    10.4.5  自定義Pipeline
    10.4.6  ColumnTransformer
  10.5  模型選擇
    10.5.1  分離標籤
    10.5.2  數值處理Pipeline
    10.5.3  線性回歸
    10.5.4  決策樹
    10.5.5  隨機森林
    10.5.6  模型微調
    10.5.7  最佳參數模型
第11章  手寫數字識別
  11.1  MNIST數據集
    11.1.1  下載數據集
    11.1.2  查看數據集
    11.1.3  繪製數字圖像
    11.1.4  不易辨認的數字圖像
    11.1.5  識別數字5的分類器
  11.2  精度與召回率
    11.2.1  類型轉換
    11.2.2  二類分類器
    11.2.3  非5分類器
    11.2.4  混淆矩陣
    11.2.5  計算精度與召回率
    11.2.6  F1分數
  11.3  閾值分類器
    11.3.1  分類器評分
    11.3.2  閾值的用法
    11.3.3  計算精度與召回率
    11.3.4  90%精度的分類器
  11.4  ROC曲線

    11.4.1  TPR與FPR
    11.4.2  繪製ROC曲線
    11.4.3  ROC曲線下的面積
    11.4.4  RandomForestClassifier
    11.4.5  比較ROC曲線
    11.4.6  比較精度與召回率
    11.4.7  比較F1分數
  11.5  多類分類器
    11.5.1  訓練集與測試集
    11.5.2  RandomForestClassifier
    11.5.3  標準縮放
    11.5.4  混淆矩陣
    11.5.5  突出錯誤率

  • 商品搜索:
  • | 高級搜索
首頁新手上路客服中心關於我們聯絡我們Top↑
Copyrightc 1999~2008 美商天龍國際圖書股份有限公司 臺灣分公司. All rights reserved.
營業地址:臺北市中正區重慶南路一段103號1F 105號1F-2F
讀者服務部電話:02-2381-2033 02-2381-1863 時間:週一-週五 10:00-17:00
 服務信箱:bookuu@69book.com 客戶、意見信箱:cs@69book.com
ICP證:浙B2-20060032