幫助中心 | 我的帳號 | 關於我們

計算智能演算法及其生產調度應用

  • 作者:任劍鋒|責編:張夢初
  • 出版社:中國經濟
  • ISBN:9787513673402
  • 出版日期:2023/07/01
  • 裝幀:平裝
  • 頁數:324
人民幣:RMB 88 元      售價:
放入購物車
加入收藏夾

內容大鋼
    本書選擇典型的流水車間調度、作業車間調度、分散式調度等問題作為研究背景,以強化學習、深度學習和其他智能演算法為研究對象,開展複雜約束條件下的車間生產調度單目標或多目標問題研究。圍繞基於監督學習的序列模型、基於值函數逼近的深度強化學習演算法、基於策略梯度的深度強化學習演算法、改進的NSGA-Ⅱ演算法、基於NASH-Q-learning的分散式演算法展開論述,並將之分別應用到不同的生產調度場景。本書基於作者多年的研究成果和實踐經驗寫成,可供從事智能製造、人工智慧、工業工程、企業管理等專業的研究人員閱讀,也可作為上述專業學生的研究、學慣用參考書。

作者介紹
任劍鋒|責編:張夢初
    任劍鋒,男,漢族,副教授,現就職于河南財經政法大學,長期從事管理科學與工程、高等教育教學管理等領域的相關研究工作,諳熟強化學習、深度學習等人工智慧方法在相關管理科學問題中的應用及其背後的數學理論基礎;同時,多年從事高等教育教學管理工作,積累了較豐富的工作經驗。

目錄
第1章  緒論
  1.1  研究背景和意義
    1.1.1  研究背景
    1.1.2  研究意義
  1.2  車間生產調度問題及研究現狀
    1.2.1  車間生產調度問題
    1.2.2  研究現狀
  1.3  研究內容及目標
    1.3.1  研究內容
    1.3.2  研究目標
  1.4  技術路線及創新點
    1.4.1  技術路線
    1.4.2  創新點
第2章  概率推理
  2.1  貝葉斯公式
  2.2  概率圖模型
    2.2.1  隱馬爾可夫模型
    2.2.2  貝葉斯網路
    2.2.3  貝葉斯網路推理
  2.3  本章小結
第3章  樣本學習
  3.1  決策樹
    3.1.1  信息增益
    3.1.2  增益率
    3.1.3  Gini指數
    3.1.4  剪枝處理
  3.2  回歸
    3.2.1  線性回歸
    3.2.2  邏輯回歸
  3.3  支持向量機
    3.3.1  硬間隔最大化支持向量機
    3.3.2  軟間隔最大化支持向量機
    3.3.3  對偶演算法
    3.3.4  非線性支持向量機
  3.4  非參數化學習
    3.4.1  KNN演算法
    3.4.2  距離計算
    3.4.3  K值確定
  3.5  集成學習
    3.5.1  Boosting演算法
    3.5.2  隨機森林
  3.6  無監督學習和半監督學習
    3.6.1  樣本的相似度
    3.6.2  類和簇
    3.6.3  層次聚類
    3.6.4  K-means聚類
  3.7  本章小結
第4章  神經網路和深度學習
  4.1  深度前饋神經網路
    4.1.1  前饋神經網路

    4.1.2  深度前饋神經網路及學習模式
  4.2  深度卷積神經網路
    4.2.1  卷積神經網路
    4.2.2  深度卷積神經網路
  4.3  深度循環神經網路
    4.3.1  循環神經網路
    4.3.2  深度循環神經網路
  4.4  深度自動編碼器
    4.4.1  欠完備自動編碼器
    4.4.2  正則自動編碼器
    4.4.3  深度自編碼器
  4.5  核函數方法深度學習
  4.6  激活函數
    4.6.1  飽和激活函數
    4.6.2  非飽和激活函數
  4.7  本章小結
第5章  強化學習
  5.1  馬爾可夫鏈蒙特卡洛方法
    5.1.1  馬爾可夫鏈
    5.1.2  馬爾可夫決策過程
  5.2  動態規劃
    5.2.1  動態規劃原理
    5.2.2  價值函數
    5.2.3  策略迭代
  5.3  深度強化學習
    5.3.1  深度強化學習基本原理
    5.3.2  基於值函數的深度強化學習
    5.3.3  基於策略梯度的深度強化學習
  5.4  本章小結
第6章  監督學習方式求解車間生產調度問題
  6.1  引言
  6.2  問題描述
  6.3  調度規則與樣本數據
    6.3.1  調度規則
    6.3.2  樣本數據
  6.4  自注意力模型
    6.4.1  基於自注意力模型的序列編碼
    6.4.2  Transformer模型
  6.5  LSTM-PtrNets-CRF模型
    6.5.1  模型框架
    6.5.2  模型訓練
  6.6  實驗與結果分析
    6.6.1  實驗設置
    6.6.2  結果對比與分析
  6.7  本章小結
第7章  值函數逼近演算法求解車間生產調度問題
  7.1  引言
  7.2  問題描述
  7.3  狀態表示和動作構建
    7.3.1  狀態表示

    7.3.2  動作構建
  7.4  狀態與動作映射
    7.4.1  網路構建
    7.4.2  網路訓練
    7.4.3  誤差反向傳播
    7.4.4  梯度下降演算法
  7.5  獎勵函數與值函數計算
    7.5.1  獎勵函數
    7.5.2  值函數逼近
    7.5.3  期望Sarsa演算法
  7.6  實驗與結果分析
    7.6.1  實驗設置
    7.6.2  結果對比與分析
  7.7  本章小結
第8章  策略梯度演算法求解車間生產調度問題
  8.1  引言
  8.2  問題描述
  8.3  注意力機制
    8.3.1  注意力分佈和打分機制
    8.3.2  指針網路
  8.4  模型框架
    8.4.1  深度序列模型
    8.4.2  長短期記憶網路
  8.5  策略梯度優化方法
    8.5.1  策略梯度定理及證明
    8.5.2  基於強化學習的序列生成
    8.5.3  A3C演算法應用
  8.6  實驗與結果分析
    8.6.1  實驗設置
    8.6.2  結果對比與分析
  8.7  本章小結
第9章  混合Q-learning演算法求解多目標車間生產調度問題
  9.1  引言
  9.2  問題描述及優化目標
    9.2.1  問題描述
    9.2.2  問題建模
    9.2.3  Pareto最優解
  9.3  改進NSGA-Ⅱ演算法
    9.3.1  編碼與解碼
    9.3.2  選擇、交叉和變異操作
    9.3.3  基於N5鄰域結構搜索策略
    9.3.4  演算法流程
  9.4  路徑優化演算法設計
    9.4.1  位置掃描
    9.4.2  節點選擇策略和信息素更新
    9.4.3  路徑優化問題編碼
  9.5  強化學習避障策略
    9.5.1  動態避障策略
    9.5.2  收斂性證明
  9.6  實驗與結果分析

    9.6.1  實驗設置
    9.6.2  結果對比與分析
  9.7  本章小結
第10章  NASH-Q-learning演算法求解分散式車間生產調度問題
  10.1  引言
  10.2  問題描述
    10.2.1  分散式置換流水車間調度
    10.2.2  問題模型
    10.2.3  複雜性分析
  10.3  迭代貪婪演算法
    10.3.1  初始化方法
    10.3.2  破壞重構策略
    10.3.3  局部搜索
    10.3.4  接受準則
  10.4  多智能體深度強化學習
    10.4.1  多智能體強化學習
    10.4.2  NASH均衡
    10.4.3  NASH-Q-learning演算法
  10.5  多智能體平均場深度強化學習演算法
    10.5.1  平均場理論
    10.5.2  多智能體平均場強化學習
    10.5.3  多智能體平均場Q-learning演算法
    10.5.4  多智能體車間調度演算法
  10.6  實驗與結果分析
    10.6.1  實驗設置
    10.6.2  結果對比與分析
  10.7  本章小結
第11章  總結與展望
  11.1  全書總結
  11.2  進一步的工作
參考文獻

  • 商品搜索:
  • | 高級搜索
首頁新手上路客服中心關於我們聯絡我們Top↑
Copyrightc 1999~2008 美商天龍國際圖書股份有限公司 臺灣分公司. All rights reserved.
營業地址:臺北市中正區重慶南路一段103號1F 105號1F-2F
讀者服務部電話:02-2381-2033 02-2381-1863 時間:週一-週五 10:00-17:00
 服務信箱:bookuu@69book.com 客戶、意見信箱:cs@69book.com
ICP證:浙B2-20060032