幫助中心 | 我的帳號 | 關於我們

Python機器學習技術(模型關係管理)

  • 作者:丁亞軍|責編:張慧敏
  • 出版社:電子工業
  • ISBN:9787121448430
  • 出版日期:2023/02/01
  • 裝幀:平裝
  • 頁數:271
人民幣:RMB 109 元      售價:
放入購物車
加入收藏夾

內容大鋼
    本書的主體內容包括機器學習概念與特徵工程、機器學習技術、模型關係管理,其中,模型關係管理部分主要介紹了弱集成學習、強集成學習和混合專家模型。
    弱集成學習是指使用機器學習中的弱分類器實現模型準確度和穩定性之間的平衡。
    強集成學習是指協同特徵工程與強分類器形成強集成學習環境。
    混合專家模型是指通過神經網路集成和網路結構設計形成深度學習框架。
    本書以案例分析為主線介紹不同的集成學習方法,首先闡述弱集成學習如何解決項目痛點問題,然後以痛點為起點,集中討論強集成學習如何解構子項目問題,最後通過深度學習分析非結構化數據。在每個案例中,歸因問題是分析的核心,提供了解析歸因問題的一系列方法,以作者多年的項目經驗為基礎,展示Python數據分析的強大之處。

作者介紹
丁亞軍|責編:張慧敏
    丁亞軍,自由職業者,兼CDA數據科學研究院研究員、電子工業出版社大數據專家委員會成員、學習路徑圖國際技術中心顧問、經管之家培訓中心講師。研究方向:統計軟體與數據分析、市場調查研究、電商CRM數據挖掘、銀行申請與行為評分卡。

目錄
第1部分 機器學習概念與特徵工程
  第1章  機器學習的基礎概念
    1.1  數據源
      1.1.1  數值:單元格
      1.1.2  圖像:像素點
      1.1.3  文本:詞向量
    1.2  模型的基本形式:回歸
      1.2.1  文氏圖:方差分解
      1.2.2  分佈圖:分佈與隨機
      1.2.3  角色:監督與非監督
      1.2.4  模型應用:歸因與預測
    1.3  模型與演算法
      1.3.1  模型進化:從1.0到4.0
      1.3.2  演算法驅動:參數與超參數
    1.4  SMD學習技術
      1.4.1  統計學習:線性回歸
      1.4.2  機器學習:支持向量機
      1.4.3  深度學習:神經網路
    1.5  機器學習誤差源
      1.5.1  誤差源
      1.5.2  偏差與方差窘境
    1.6  模型擬合診斷
      1.6.1  模型擬合
      1.6.2  模型的評估指標
    1.7  數據分區技術
      1.7.1  數據分區:訓練與評估
      1.7.2  交叉驗證:分區的升級
    1.8  集成學習方法
      1.8.1  強分類器:特徵工程+模型
      1.8.2  弱分類器:模型+模型
      1.8.3  混合專家:神經網路
    1.9  運算加速度
      1.9.1  大數據挑戰
      1.9.2  數據的高效運算
  第2章  特徵工程技術
    2.1  數據變換
      2.1.1  特徵規範化:對中處理
      2.1.2  樣本規範化:距離相似度
    2.2  數據編碼
      2.2.1  獨熱編碼:無序性
      2.2.2  數據分箱:業務標籤
    2.3  缺失值填補
      2.3.1  中位數填補:穩健
      2.3.2  最近鄰填補:高維
      2.3.3  隨機森林填補:「賢內助」
    2.4  異常值診斷
      2.4.1  單變數異常值:描述
      2.4.2  多變數異常值:監督
      2.4.3  多變數異常值:非監督
      2.4.4  非結構式異常值:自編碼器

    2.5  共線性的危害
      2.5.1  雙變數共線:新特徵
      2.5.2  多變數共線:特徵分解
      2.5.3  特徵組合技術
    2.6  特徵篩選技術
      2.6.1  經驗:「站在誰的肩膀上」
      2.6.2  相關:相關係數
      2.6.3  回歸:特徵篩選
      2.6.4  降維:線性與非線性
      2.6.5  工具:「指南針」
    2.7  聚類技術:市場細分
第2部分 機器學習技術
  第3章  機器學習準備
    3.1  機器學習的數學基礎
      3.1.1  微積分基礎
      3.1.2  向量運算:相關分析
      3.1.3  矩陣運算:回歸模型
      3.1.4  張量運算:神經網路
    3.2  機器學習理解
      3.2.1  連續型因變數:線性回歸
      3.2.2  分類型因變數:邏輯回歸
    3.3  機器學習演算法
      3.3.1  最小二乘法:準確度
      3.3.2  最大似然估計法:測量
      3.3.3  隨機梯度下降法:大數據
  第4章  統計學:回歸「進化」
    4.1  大數據與回歸模型
      4.1.1  統計學的煩惱
      4.1.2  線性回歸的進化
    4.2  正則化約束
      4.2.1  正則化技術的原理
      4.2.2  LASSO 回歸與嶺回歸
      4.2.3  彈性網的特徵
    4.3  案例:隨機梯度下降回歸與歸因解釋
  第5章  神經網路模型:預測
    5.1  感知器模型
      5.1.1  與或四門通往何方
      5.1.2  感知器=線性回歸
      5.1.3  激活函數為何是非線性的
      5.1.4  感知器=CPU
    5.2  神經網路模型
      5.2.1  感知器集成:網路結構
      5.2.2  前向傳播技術:聯立方程
      5.2.3  反向傳播技術:自動微分
      5.2.4  網路結構設計:隱含層
      5.2.5  神經網路專題1:特徵工程
      5.2.6  神經網路專題2:維度災難
    5.3  案例:數據分析流與神經網路
  第6章  決策樹:歸因與可視化
    6.1  決策樹模型原理

      6.1.1  熵與相關性
      6.1.2  決策樹概覽
      6.1.3  特徵分叉運算
      6.1.4  特徵選擇運算
      6.1.5  決策樹與剪枝
    6.2  樹模型的特徵
    6.3  兩類歸因:決策樹與邏輯回歸
      6.3.1  樹形圖解釋
      6.3.2  S形圖解釋
  第7章  支持向量機:高維數據
    7.1  支持向量機簡介
      7.1.1  超平面
      7.1.2  點距超平面
    7.2  線性支持向量機
      7.2.1  硬間隔:嚴格邊界
      7.2.2  軟間隔:鬆弛邊界
    7.3  非線性與核技巧
      7.3.1  理解核技巧
      7.3.2  核函數及其應用
      7.3.3  支持向量機:經驗匯總
    7.4  支持向量機模型運算
    7.5  案例:圖像識別與預測分類
  第8章  關聯分析
    8.1  數據源格式
      8.1.1  標準數據格式
      8.1.2  概念的層級性
    8.2  關聯規則與度量指標
      8.2.1  關聯規則度量
      8.2.2  頻繁項集
      8.2.3  Apriori演算法
      8.2.4  強關聯規則
    8.3  案例:商品關聯過濾與營銷推薦
第3部分 模型關係管理
  第9章  集成學習方法:弱集成
    9.1  集成學習:弱分類器
      9.1.1  自抽樣法
      9.1.2  套袋法與隨機森林
      9.1.3  套袋法的運算
      9.1.4  隨機森林與特徵工程
      9.1.5  提升法與提升樹
      9.1.6  提升法的運算
      9.1.7  XGBoost的原理與應用
    9.2  集成學習:聚合策略
      9.2.1  簡單投票法
      9.2.2  堆疊法
      9.2.3  理論判斷法
      9.2.4  元分析法
      9.2.5  結構方程模型
  第10章  多階段模型管理:強集成
    10.1  特徵工程與模型集成

      10.1.1  機器學習與模型關係管理
      10.1.2  「主成分+」與「聚類+」模式
    10.2  多階段模型管理與案例解析
      10.2.1  線性與非線性:決策樹+回歸
      10.2.2  異常診斷一:異常評分+主次歸因+規則歸因
      10.2.3  異常診斷二:異常規則+複雜歸因
      10.2.4  經驗法:貝葉斯規則+回歸
      10.2.5  不平衡修正:平衡性抽樣+模型集成
      10.2.6  數據源:問卷+資料庫
  第11章  深度學習模型:混合專家
    11.1  全連接神經網路:數值分析
      11.1.1  全連接神經網路規則
      11.1.2  梯度爆炸與梯度消失
      11.1.3  全連接層:正則化
      11.1.4  構建全連接神經網路
    11.2  卷積神經網路:圖像識別
      11.2.1  卷積層:核運算
      11.2.2  池化層:標準化
      11.2.3  全連接層:信息傳遞
      11.2.4  構建卷積神經網路
    11.3  循環神經網路:自然語言處理
      11.3.1  概率語言模型
      11.3.2  循環神經網路
      11.3.3  長短期記憶網路
      11.3.4  構建循環神經網路
  第12章  自動化機器學習
    12.1  自動化與集成學習
      12.1.1  自動化集成
      12.1.2  TPOT配置
      12.1.3  案例:模型複雜度評估
    12.2  數據分析流水線
      12.2.1  數據分析流
      12.2.2  模型失效周期
      12.2.3  知識發現與模型
      12.2.4  流水線技術準備
      12.2.5  創建複雜流水線
    12.3  超參數與高效運行
      12.3.1  熱啟動
      12.3.2  隨機搜索
      12.3.3  貝葉斯搜索
      12.3.4  增量學習
總結與展望

  • 商品搜索:
  • | 高級搜索
首頁新手上路客服中心關於我們聯絡我們Top↑
Copyrightc 1999~2008 美商天龍國際圖書股份有限公司 臺灣分公司. All rights reserved.
營業地址:臺北市中正區重慶南路一段103號1F 105號1F-2F
讀者服務部電話:02-2381-2033 02-2381-1863 時間:週一-週五 10:00-17:00
 服務信箱:bookuu@69book.com 客戶、意見信箱:cs@69book.com
ICP證:浙B2-20060032