幫助中心 | 我的帳號 | 關於我們

機器學習全解(R語言版)

  • 作者:黃天元|責編:胡俊英
  • 出版社:人民郵電
  • ISBN:9787115641465
  • 出版日期:2024/07/01
  • 裝幀:平裝
  • 頁數:200
人民幣:RMB 69.8 元      售價:
放入購物車
加入收藏夾

內容大鋼
    機器學習是近年來非常熱門的學科,R語言經過一段時間的發展也逐漸成為主流的編程語言之一。本書結合機器學習和R語言,面向機器學習實踐,不僅介紹了機器學習和R語言的基礎知識,而且介紹了如何借助不同的演算法來進行模型分析,以及這些演算法在R語言中的實現方式。通過閱讀本書,讀者可以快速了解機器學習和R語言的必備知識,掌握機器學習的實現流程。
    本書適合程序員、數據分析人員、對演算法感興趣的讀者、機器學習領域的從業人員及科研人員閱讀。

作者介紹
黃天元|責編:胡俊英
    黃天元     復旦大學博士,中國科學院博士后,現任浙江財經大學講師。熱愛數據科學與開源工具,致力於利用數據科學迅速積累行業經驗和探索科學發現。在CRAN上維護4個R語言包(累計下載量破10萬),著有《R語言數據高效處理指南》《文本數據挖掘:基於R語言》等圖書,並開設知乎專欄《R語言數據挖掘》

目錄
第1章  機器學習概論
  1.1  機器學習的概念
  1.2  機器學習的意義
  1.3  機器學習的種類
  1.4  機器學習基本流程
第2章  R語言綜合基礎
  2.1  簡易環境配置
  2.2  編程保留符號
  2.3  基本數據類型
    2.3.1  數值型
    2.3.2  邏輯型
    2.3.3  字元型
    2.3.4  因子型
    2.3.5  類型判斷與轉換
  2.4  常用數據結構
    2.4.1  向量
    2.4.2  矩陣
    2.4.3  列表
    2.4.4  數據框
  2.5  程序流程式控制制
    2.5.1  選擇結構
    2.5.2  循環結構
  2.6  函數使用技巧
第3章  高效數據操作
  3.1  R數據操作包簡介
  3.2  數據讀寫
  3.3  管道操作符
  3.4  基本操作
    3.4.1  篩選列
    3.4.2  篩選行
    3.4.3  更新
    3.4.4  排序
    3.4.5  匯總
    3.4.6  分組計算
    3.4.7  列的重命名
  3.5  多表連接
  3.6  長寬轉換
  3.7  集合運算
  3.8  缺失值處理
  3.9  列表列的運用
第4章  tidyverse快速入門
  4.1  數據讀取(readr)
  4.2  數據整理
    4.2.1  批處理(purrr)
    4.2.2  因子操作(forcats)
    4.2.3  時間操作(lubridate)
    4.2.4  字元串操作(stringr)
    4.2.5  數據框清洗(tibbledplyrtidyr)
  4.3  數據可視化(ggplot2)
第5章  探索性數據分析

  5.1  基本概念介紹
    5.1.1  平均值
    5.1.2  標準差
    5.1.3  極值
    5.1.4  中位數
    5.1.5  相關係數
  5.2  探索工具實踐
    5.2.1  vtree
    5.2.2  skimr
    5.2.3  naniar
第6章  特徵工程
  6.1  特徵修飾
    6.1.1  歸一化
    6.1.2  數據分箱
    6.1.3  缺失值填補
  6.2  特徵構造
    6.2.1  構造交互項
    6.2.2  基於降維技術的特徵構造
    6.2.3  One-Hot編碼
  6.3  特徵篩選
    6.3.1  過濾法
    6.3.2  封裝法
    6.3.3  嵌入法
第7章  重採樣方法
  7.1  針對模型評估的重採樣
    7.1.1  交叉驗證
    7.1.2  自舉法
  7.2  針對類失衡的重採樣
第8章  模型表現的衡量
  8.1  回歸模型的表現衡量
  8.2  分類模型的表現衡量
第9章  模型選擇
  9.1  機器學習模型概覽
    9.1.1  線性回歸
    9.1.2  K近鄰演算法(KNN)
    9.1.3  樸素貝葉斯方法
    9.1.4  判別分析
    9.1.5  支持向量機
    9.1.6  人工神經網路
    9.1.7  決策樹
    9.1.8  隨機森林
    9.1.9  梯度下降法
  9.2  mlr3工作流簡介
    9.2.1  環境配置
    9.2.2  任務定義
    9.2.3  學習器選擇
    9.2.4  訓練與預測
  9.3  基於mlr3的模型篩選
第10章  參數調節
  10.1  指定終止搜索條件

  10.2  設置指定參數組合
  10.3  範圍內網格搜索
  10.4  範圍內隨機搜索
第11章  模型分析
  11.1  變數重要性評估
  11.2  變數影響作用分析
  11.3  基於個案的可加性歸因方法
第12章  集成學習
  12.1  集成學習的三種策略
    12.1.1  裝袋法簡介
    12.1.2  提升法簡介
    12.1.3  堆疊法簡介
  12.2  基於caret與caretEnsemble框架的集成學習實現
    12.2.1  環境部署
    12.2.2  數據準備
    12.2.3  裝袋法
    12.2.4  提升法
    12.2.5  堆疊
第13章  實踐案例一:基於caret包對泰坦尼克號乘客存活率進行二分類預測
  13.1  工具簡介
  13.2  問題背景
  13.3  數據審視
  13.4  特徵工程
  13.5  數據劃分
  13.6  模型訓練
  13.7  模型的預測與評估
  13.8  超參數調節
第14章  實踐案例二:基於mlr框架對波士頓房價進行回歸預測
  14.1  工具簡介
  14.2  問題背景
  14.3  數據審視與預處理
  14.4  任務定義
  14.5  建模與調參
  14.6  模型表現比較
  14.7  進一步的參數調節
  14.8  模型解釋
第15章  實踐案例三:基於mlr3框架對皮馬印第安人糖尿病數據集進行特徵篩選
  15.1  工具簡介
  15.2  問題背景
  15.3  去除冗余特徵
  15.4  特徵重要性排序
  15.5  利用封裝法對特徵進行篩選
第16章  實踐案例四:基於tidymodels框架對鳶尾花進行多分類預測
  16.1  工具簡介
  16.2  問題背景
  16.3  數據集劃分
  16.4  數據預處理
  16.5  指定重採樣方法
  16.6  模型定義與調參
  16.7  觀察模型在測試集的表現

  • 商品搜索:
  • | 高級搜索
首頁新手上路客服中心關於我們聯絡我們Top↑
Copyrightc 1999~2008 美商天龍國際圖書股份有限公司 臺灣分公司. All rights reserved.
營業地址:臺北市中正區重慶南路一段103號1F 105號1F-2F
讀者服務部電話:02-2381-2033 02-2381-1863 時間:週一-週五 10:00-17:00
 服務信箱:bookuu@69book.com 客戶、意見信箱:cs@69book.com
ICP證:浙B2-20060032