幫助中心 | 我的帳號 | 關於我們

信息物理系統強化學習(網路安全示例)/電腦科學叢書

  • 作者:(美)李崇//邱美康|責編:王春華//馮秀泳|譯者:盧苗苗//計湘婷//何源//席瑞//金夢
  • 出版社:機械工業
  • ISBN:9787111676478
  • 出版日期:2021/03/01
  • 裝幀:平裝
  • 頁數:172
人民幣:RMB 79 元      售價:
放入購物車
加入收藏夾

內容大鋼
    本書通過系統介紹強化學習領域的基礎與演算法,在強化學習與信息物理系統兩個領域之間建立起聯繫,每一部分都列舉了一個或幾個最新的信息物理系統示例,以幫助讀者直觀地理解強化學習技術的實用性。本書分為三個部分。第一部分對強化學習、信息物理系統和網路安全進行了概要介紹。第二部分正式介紹強化學習的框架,並對強化學習問題進行定義,給出了兩類解決方法-基於模型的解決方案和無模型的解決方案。第三部分通過回顧現有的網路安全技術並描述新興的網路威脅,將注意力轉移到網路安全,之後給出了兩個案例研究。

作者介紹
(美)李崇//邱美康|責編:王春華//馮秀泳|譯者:盧苗苗//計湘婷//何源//席瑞//金夢

目錄
出版者的話
譯者序
前言
作者簡介
第一部分  介紹
  第1章  強化學習概述
    1.1  強化學習綜述
      1.1.1  引言
      1.1.2  與其他機器學習方法的比較
      1.1.3  強化學習示例
      1.1.4  強化學習應用
    1.2  強化學習的發展歷史
      1.2.1  傳統的強化學習
      1.2.2  深度強化學習
    1.3  強化學習的模擬工具
    1.4  本章小結
  第2章  信息物理系統和網路安全概述
    2.1  引言
    2.2  信息物理系統研究示例
      2.2.1  資源分配
      2.2.2  數據傳輸與管理
      2.2.3  能源控制
      2.2.4  基於模型的軟體設計
    2.3  網路安全威脅
      2.3.1  網路安全的對手
      2.3.2  網路安全的目標
    2.4  本章小結
    2.5  練習
第二部分  強化學習在信息物理系統中的應用
  第3章  強化學習問題
    3.1  多臂賭博機問題
      3.1.1  ε-greedy演算法
      3.1.2  softmax演算法
      3.1.3  UCB演算法
    3.2  上下文賭博機問題
    3.3  完整的強化學習問題
      3.3.1  強化學習的要素
      3.3.2  馬爾可夫決策過程介紹
      3.3.3  值函數
    3.4  本章小結
    3.5  練習
  第4章  基於模型的強化學習
    4.1  引言
    4.2  動態規劃
      4.2.1  策略迭代法
      4.2.2  價值迭代法
      4.2.3  非同步動態規劃
    4.3  部分可觀察馬爾可夫決策過程
    4.4  連續馬爾可夫決策過程
      4.4.1  惰性近似

      4.4.2  函數近似
    4.5  本章小結
    4.6  練習
  第5章  無模型強化學習
    5.1  引言
    5.2  強化學習預測
      5.2.1  蒙特卡羅學習
      5.2.2  時序差分學習
    5.3  強化學習控制
      5.3.1  蒙特卡羅控制
      5.3.2  基於時序差分的控制
      5.3.3  策略梯度
      5.3.4  actor-critic
    5.4  高級演算法
      5.4.1  期望Sarsa
      5.4.2  雙Q-learning
    5.5  本章小結
    5.6  練習
  第6章  深度強化學習
    6.1  引言
    6.2  深度神經網路
      6.2.1  卷積神經網路
      6.2.2  循環神經網路
    6.3  深度學習在值函數上的應用
    6.4  深度學習在策略函數上的應用
      6.4.1  DDPG
      6.4.2  A3C
    6.5  深度學習在強化學習模型上的應用
    6.6  深度強化學習計算效率
    6.7  本章小結
    6.8  練習
第三部分  案例研究
  第7章  強化學習與網路安全
    7.1  傳統的網路安全方法
      7.1.1  傳統的網路安全技術
      7.1.2  新興網路安全威脅
    7.2  強化學習在網路安全中的應用
      7.2.1  移動群智感知中的虛假感知攻擊
      7.2.2  認知無線電網路中的安全強化
      7.2.3  移動邊緣計算中的安全問題
      7.2.4  網路安全分析師的動態調度
    7.3  本章小結
    7.4  練習
  第8章  案例研究:智能電網中的在線網路攻擊檢測
    8.1  引言
    8.2  系統模型和狀態估計
      8.2.1  系統模型
      8.2.2  狀態估計
    8.3  問題描述
    8.4  解決方案

    8.5  模擬結果
      8.5.1  模擬設計與參數設置
      8.5.2  性能評估
    8.6  本章小結
  第9章  案例研究:擊敗中間人攻擊
    9.1  引言
    9.2  強化學習方法
      9.2.1  狀態空間
      9.2.2  行動空間
      9.2.3  獎勵
    9.3  實驗和結果
      9.3.1  模型訓練
      9.3.2  在線實驗
    9.4  討論
      9.4.1  基於探測器的檢測系統
      9.4.2  運用SDN/OpenFlow使模型實用
    9.5  本章小結
參考文獻
索引

  • 商品搜索:
  • | 高級搜索
首頁新手上路客服中心關於我們聯絡我們Top↑
Copyrightc 1999~2008 美商天龍國際圖書股份有限公司 臺灣分公司. All rights reserved.
營業地址:臺北市中正區重慶南路一段103號1F 105號1F-2F
讀者服務部電話:02-2381-2033 02-2381-1863 時間:週一-週五 10:00-17:00
 服務信箱:bookuu@69book.com 客戶、意見信箱:cs@69book.com
ICP證:浙B2-20060032