內容大鋼
本書通過對大量實際案例的分析以及部分相關理論的適當解讀,幫助讀者使用Python語言進行程序設計,同時能夠利用Python語言實現基礎的機器學習演算法。
全書包含三大部分:機器學習概念和編程基礎、數據預處理基礎、機器學習方法及案例,每一部分都結合大量實際常式進行解讀。本書共13章,具體內容包括機器學習概述、Python機器學習基礎庫、數據預處理、K近鄰演算法、樸素貝葉斯、決策樹、隨機森林、AdaBoost模型、支持向量機、人工神經網路、K均值聚類、財政收入影響因素分析及預測案例、偷稅漏稅行為識別分析案例。書末給出兩個附錄,分別為Python的安裝與環境配置和Python開發工具的安裝。
本書適合作為電子信息類專業的教材,希望學習機器學習技術的讀者均可使用。學習本書需要具備Python程序設計基礎知識。
本書免費提供書中程序代碼和部分數據集、PPT及部分案例講解視頻、Python的安裝與環境配置、Python開發工具的安裝等資源,需要的讀者可以掃描扉頁二維碼或從出版社網站查看。
目錄
第1章 機器學習概述
1.1 什麼是機器學習
1.2 機器學習的應用
1.2.1 圖像和電腦視覺
1.2.2 日常生活及消費
1.2.3 金融領域
1.2.4 醫療領域
1.2.5 自然語言處理
1.2.6 安全和異常行為監測
1.2.7 工業和商業領域
1.2.8 娛樂領域
1.3 機器學習的主要研究內容
1.4 機器學習問題的常規處理方法
1.4.1 開發機器學習應用的一般步驟
1.4.2 選擇合適的演算法
1.4.3 使用Python開發機器學習應用
1.4.4 機器學習模型的評價
1.5 機器學習、模式識別、數據挖掘和人工智慧的關係
本章小結
思考題
第2章 Python機器學習基礎庫
2.1 Numpy
2.1.1 Numpy庫的安裝
2.1.2 Numpy庫的導入
2.1.3 創建數組
2.1.4 查詢數組類型
2.1.5 數組的其他創建方式
2.1.6 數組元素的存取
2.1.7 ufunc運算
2.1.8 矩陣的運算
2.2 Pandas
2.2.1 Pandas的安裝
2.2.2 Pandas的導入
2.2.3 Series
2.2.4 DataFrame
2.3 Matplotlib
2.3.1 Matplotlib的安裝
2.3.2 Matplotlib的導入
2.3.3 基本繪圖命令plot
2.3.4 繪製多窗口圖形
2.3.5 文本註釋
2.4 Scipy
2.4.1 Scipy的安裝
2.4.2 Scipy的導入
2.4.3 最小二乘法
2.4.4 非線性方程求解
2.5 Scikit-Learn
2.5.1 Scikit-Learn的安裝
2.5.2 Scikit-Learn的數據集
2.6 TensorFlow
2.6.1 TensorFlow的安裝
2.6.2 TensorFlow的使用
2.7 PyTorch
2.8 PaddlePaddle
本章小結
思考題
第3章 數據預處理
3.1 數據預處理概述
3.2 數據預分析
3.2.1 統計特性分析
3.2.2 數據質量分析
3.3 數據清理
3.3.1 異常值處理
3.3.2 缺失值處理
3.4 數據集成
3.4.1 實體識別
3.4.2 冗余屬性識別
3.5 數據變換
3.5.1 簡單函數變換
3.5.2 歸一化
3.5.3 連續屬性離散化
3.6 數據規約
3.6.1 屬性規約
3.6.2 數值規約
3.7 Python的主要數據預處理函數
本章小結
思考題
第4章 K近鄰演算法
4.1 模型介紹
4.1.1 演算法概述
4.1.2 演算法基本原理
4.1.3 演算法實現代碼
4.2 案例一 約會網站配對
4.2.1 問題介紹
4.2.2 數據準備
4.2.3 演算法實現
4.2.4 演算法測試
4.2.5 演算法應用
4.3 案例二 手寫數字識別
4.3.1 問題介紹
4.3.2 數據準備
4.3.3 演算法實現
4.4 案例三 鳶尾花品種識別
4.4.1 問題介紹
4.4.2 數據準備
4.4.3 演算法實現
本章小結
思考題
第5章 樸素貝葉斯
5.1 模型介紹
5.1.1 貝葉斯決策理論基礎
5.1.2 使用樸素貝葉斯進行分類
5.1.3 樸素貝葉斯分類器的特點
5.2 案例四 社區留言板文本分類
5.2.1 案例介紹
5.2.2 數據準備
5.2.3 概率計算
5.2.4 演算法改進
5.2.5 改進后的樸素貝葉斯分類器應用
5.3 案例五 舊金山犯罪分類預測
5.3.1 案例介紹
5.3.2 數據準備
5.3.3 模型實現
本章小結
思考題
第6章 決策樹
6.1 模型介紹
6.1.1 決策樹概述
6.1.2 決策樹數學基礎
6.1.3 決策樹演算法
6.2 案例六 魚類和非魚類判定
6.2.1 案例介紹
6.2.2 案例實現
6.3 案例七 貸款許可權判定
6.3.1 案例介紹
6.3.2 案例實現
本章小結
思考題
第7章 隨機森林
7.1 模型介紹
7.1.1 隨機森林的歷史
7.1.2 隨機森林原理
7.1.3 構建隨機森林
7.1.4 隨機森林模型的性能評估
7.1.5 隨機森林的應用
7.1.6 隨機森林的Python常用庫
7.2 案例八 聲吶信號分類
7.2.1 案例介紹
7.2.2 案例實現
7.3 案例九 泰坦尼克號倖存者預測
7.3.1 案例介紹
7.3.2 案例實現
本章小結
思考題
第8章 AdaBoost模型
8.1 模型介紹
8.1.1 AdaBoost原理
8.1.2 AdaBoost的演算法流程
8.1.3 AdaBoost的Python常用庫
8.2 案例十 馬疝病預測
8.2.1 案例介紹
8.2.3 案例實現
8.3 案例十一 學生課程成績預測
8.3.1 案例介紹
8.3.2 案例實現
本章小結
思考題
第9章 支持向量機
9.1 線性支持向量機
9.1.1 間隔與支持向量
9.1.2 對偶問題
9.1.3 SMO演算法
9.2 非線性分類
9.2.1 核函數概述
9.2.2 高斯徑向基核函數
9.3 案例十二 手寫數字識別
本章小結
思考題
第10章 人工神經網路
10.1 從感知機到多層感知機
10.1.1 神經元和感知機
10.1.2 多層感知機
10.2 激活函數和損失函數
10.2.1 激活函數
10.2.2 損失函數
10.3 反向傳播演算法
10.4 案例十三 手寫數字識別
10.4.1 數據準備
10.4.2 網路配置
10.4.3 模型訓練
10.4.4 模型使用
本章小結
思考題
第11章 K均值聚類
11.1 模型介紹
11.1.1 模型概述
11.1.2 基本的K均值聚類演算法
11.1.3 K均值聚類演算法的代碼實現
11.1.4 二分K均值演算法
11.2 案例十四 居民家庭消費調查
11.2.1 案例介紹
11.2.2 案例實現
11.3 案例十五 物流公司最佳配送路徑問題
本章小結
思考題
第12章 財政收入影響因素分析及預測案例
12.1 案例引入
12.2 模型介紹
12.3 案例操作
12.3.1 案例步驟
12.3.2 案例實現
本章小結
思考題
第13章 偷稅漏稅行為識別分析案例
13.1 案例引入
13.2 模型介紹
13.3 案例操作
13.3.1 案例步驟
13.3.2 案例實現
本章小結
思考題
附錄A Python的安裝與環境配置
A.1 Python的官方安裝
A.1.1 Python的官方下載
A.1.2 Python的官方安裝
A.1.3 手動配置環境變數
A.2 Anaconda的安裝
A.2.1 Anaconda的下載
A.2.2 Anaconda的安裝
A.2.3 手動配置Anaconda的環境變數
A.2.4 Anaconda的運行
附錄B Python開發工具的安裝
B.1 Jupyter Notebook的安裝
B.1.1