幫助中心 | 我的帳號 | 關於我們

網路智能化中的深度強化學習技術

  • 作者:戚琦//付霄元//莊子睿//王敬宇//廖建新|責編:代曉麗
  • 出版社:人民郵電
  • ISBN:9787115572639
  • 出版日期:2023/04/01
  • 裝幀:平裝
  • 頁數:244
人民幣:RMB 149.8 元      售價:
放入購物車
加入收藏夾

內容大鋼
    隨著人工智慧技術的廣泛應用,網路智能化近年來受到廣泛的關注,已經成為下一代移動通信與未來網路的重要技術。阿爾法圍棋(AlphaGo)之後,深度強化學習不斷推陳出新,為網路中的決策問題提供了有效的潛在解決方案。本書系統介紹了網路智能化中深度強化學習的基本理論、演算法及應用場景。全書共8章,針對互聯網、移動通信網、邊緣網路、數據中心等典型網路,闡述了網路管理、網路控制、任務調度等決策需求,深入論述了深度強化學習的模型構建與應用技術。第1章介紹了網路智能的需求與挑戰;第2章介紹了先進的深度強化學習模型與方法;第3?6章論述了無線接入優化、網路管理、網路控制與任務調度等普遍網路管控任務中,深度強化學習技術的應用方法;第7章和第8章論述了深度強化學習在流媒體控制以及自組織網路等典型場景中的新研究進展。
    本書可為高等院校電腦和通信相關專業的本科生、研究生提供參考,也可供對網路智能化與深度強化學習領域感興趣的研究人員和工程技術人員參考。

作者介紹
戚琦//付霄元//莊子睿//王敬宇//廖建新|責編:代曉麗

目錄
第1章  網路智能概述
  1.1  概述
    1.1.1  網路架構的持續演進
    1.1.2  網路管理與控制的挑戰
    1.1.3  網路智能的興起
  1.2  網路智能的基礎
    1.2.1  大數據
    1.2.2  算力支持
    1.2.3  集中式控制
  1.3  網路智能的現狀
    1.3.1  意圖網路
    1.3.2  自動駕駛網路
    1.3.3  知識定義網路
    1.3.4  標準化工作
  1.4  網路智能的實現途徑
    1.4.1  監督學習
    1.4.2  無監督學習
    1.4.3  強化學習
  1.5  網路智能的願景與挑戰
    1.5.1  網路智能的願景
    1.5.2  網路智能的挑戰
  參考文獻
第2章  深度強化學習方法
  2.1  強化學習方法概述
    2.1.1  馬爾可夫決策過程
    2.1.2  多臂賭博機
    2.1.3  蒙特卡洛樹搜索與時間差分方法
    2.1.4  值迭代與策略迭代
  2.2  深度強化學習
    2.2.1  深度Q網路
    2.2.2  策略梯度方法
    2.2.3  策略梯度單調提升優化演算法
    2.2.4  最大熵演算法
  2.3  多智能體強化學習
    2.3.1  獨立強化學習及其湧現行為分析
    2.3.2  多智能體通信
    2.3.3  多智能體合作機制
    2.3.4  多智能體建模與策略推斷
  2.4  分層強化學習
  2.5  遷移強化學習
    2.5.1  遷移強化學習框架
    2.5.2  根據遷移設置的分類
    2.5.3  根據遷移知識類型的分類
    2.5.4  根據遷移目標的分類
  2.6  多任務強化學習
    2.6.1  多任務學習基本概念
    2.6.2  多任務強化學習
    2.6.3  基於多任務學習的遷移強化學習
  2.7  逆強化學習
  2.8  分散式強化學習

  參考文獻
第3章  基於強化學習的無線接入優化
  3.1  多通道無線接入
    3.1.1  多通道無線接入概述
    3.1.2  基於DRL的動態多通道無線接入
    3.1.3  異構無線網路的多通道接入
  3.2  異構無線網路的調製和編碼
    3.2.1  調製和編碼問題概述
    3.2.2  基於DRL的調製和編碼
  3.3  基站自適應能量控制
    3.3.1  基站自適應能量控制內容概述
    3.3.2  基站自適應能量控制問題引入
    3.3.3  基於DRL的自適應能量控制
  參考文獻
第4章  基於強化學習的網路管理
  4.1  智能服務編排
    4.1.1  NFV的資源配置
    4.1.2  服務功能鏈映射
    4.1.3  服務功能鏈選路
    4.1.4  無線網路VNF的資源編排
  4.2  智能網路切片
    4.2.1  網路切片的需求與概念
    4.2.2  網路切片的資源管理
    4.2.3  無線接入網切片
    4.2.4  核心網切片
  參考文獻
第5章  基於強化學習的網路控制
  5.1  智能路由控制
    5.1.1  時間相關QoS的路由控制
    5.1.2  邊緣網路路由控制
    5.1.3  帶緩存的DCN路由控制
  5.2  智能擁塞控制
    5.2.1  多路徑TCP控制
    5.2.2  智能擁塞控制模型Aurora
  5.3  智能流量調度
    5.3.1  流量工程概述
    5.3.2  智能流量調度
    5.3.3  分散式流量調度
  參考文獻
第6章  基於強化學習的任務調度
  6.1  並行計算的任務調度
    6.1.1  問題定義
    6.1.2  基於RL的並行任務調度方法
    6.1.3  基於DRL的並行任務調度方法
  6.2  基於有向無環圖的任務調度
    6.2.1  分散式系統任務模型
    6.2.2  邊緣計算任務調度
    6.2.3  雲計算的任務調度
    6.2.4  數據處理集群的任務調度
  6.3  混合任務調度

    6.3.1  多類型任務調度
    6.3.2  任務調度相關的聯合優化
  參考文獻
第7章  基於強化學習的流媒體控制
  7.1  超低時延的流媒體傳輸
    7.1.1  超低時延的流媒體傳輸框架
    7.1.2  碼率自適應演算法
    7.1.3  基於強化學習的超低時延傳輸演算法
  7.2  個性化的流媒體傳輸
    7.2.1  個性化用戶體驗
    7.2.2  基於強化學習的個性化QoE設計
  7.3  新場景下的流媒體傳輸展望
  參考文獻
第8章  基於強化學習的自組織網路
  8.1  網聯自動駕駛
    8.1.1  車載通信任務
    8.1.2  車載資源分配
  8.2  無人機網路概述
    8.2.1  無人機通信資源調度
    8.2.2  無人機公平效率覆蓋
    8.2.3  無人機感測數據收集
  參考文獻
名詞索引

  • 商品搜索:
  • | 高級搜索
首頁新手上路客服中心關於我們聯絡我們Top↑
Copyrightc 1999~2008 美商天龍國際圖書股份有限公司 臺灣分公司. All rights reserved.
營業地址:臺北市中正區重慶南路一段103號1F 105號1F-2F
讀者服務部電話:02-2381-2033 02-2381-1863 時間:週一-週五 10:00-17:00
 服務信箱:bookuu@69book.com 客戶、意見信箱:cs@69book.com
ICP證:浙B2-20060032