幫助中心 | 我的帳號 | 關於我們

Python深度強化學習(基於Chainer和OpenAI Gym)/輕鬆上手IT技術日文譯叢

  • 作者:(日)牧野浩二//西崎博光|責編:趙亮宇//李美瑩|譯者:申富饒//于?
  • 出版社:機械工業
  • ISBN:9787111692584
  • 出版日期:2021/11/01
  • 裝幀:平裝
  • 頁數:215
人民幣:RMB 79 元      售價:
放入購物車
加入收藏夾

內容大鋼
    近年來,機器學習受到了人們的廣泛關注。本書面向普通大眾,指導讀者在Python(基於Chainer和OpenAI Gym)中實踐深度強化學習。讀者只需要具備一些基本的編程經驗即可讀懂書中內容,通過實現具體程序來掌握深度強化學習的相關知識。
    本書內容:
    介紹深度學習、強化學習和深度強化學習的基本知識。
    通過多種實際對戰遊戲(如太空侵略者、吃豆人)來介紹演算法,如ε-greedy演算法。
    使用Anaconda設置本地PC,在倒立擺和老鼠學習問題中實現深度強化學習。
    使用Python實現MNIST手寫數字分類任務。
    實現深度強化學習的基本演算法DQN。
    詳解繼DQN之後提出的新的深度強化學習技術(DDQN、PER-DQN、DDPG和A3C等)。

作者介紹
(日)牧野浩二//西崎博光|責編:趙亮宇//李美瑩|譯者:申富饒//于?

目錄
譯者序
前言
第1章  引言
  1.1  深度強化學習可以做什麼
  1.2  本書的結構
  1.3  框架:Chainer和ChainerRL
  1.4  Python的運行檢查
  1.5  Chainer的安裝
  1.6  ChainerRL的安裝
  1.7  模擬器:OpenAI Gym
第2章  深度學習
  2.1  什麼是深度學習
  2.2  神經網路
  2.3  基於Chainer的神經網路
    2.3.1  Chainer與神經網路的對應
    2.3.2  Chainer程序
    2.3.3  參數設置
    2.3.4  創建數據
    2.3.5  定義神經網路
    2.3.6  各種聲明
    2.3.7  顯示訓練狀態
    2.3.8  保存訓練狀態
    2.3.9  執行訓練
  2.4  與其他神經網路的對應
    2.4.1  感知器
    2.4.2  5層神經網路(深度學習)
    2.4.3  計算輸入中的1的數量
  2.5  基於深度神經網路的手寫數字識別
    2.5.1  手寫數字的輸入格式
    2.5.2  深度神經網路的結構
    2.5.3  8×8的手寫數字數據
  2.6  基於卷積神經網路的手寫數字識別
    2.6.1  卷積
    2.6.2  激活函數
    2.6.3  池化
    2.6.4  執行
  2.7  一些技巧
    2.7.1  讀取文件數據
    2.7.2  使用訓練模型
    2.7.3  重啟訓練
    2.7.4  檢查權重
    2.7.5  從文件中讀取手寫數字
第3章  強化學習
  3.1  什麼是強化學習
    3.1.1  有監督學習
    3.1.2  無監督學習
    3.1.3  半監督學習
  3.2  強化學習原理
  3.3  通過簡單的示例來學習
  3.4  應用到Q學習問題中

    3.4.1  狀態
    3.4.2  行動
    3.4.3  獎勵
    3.4.4  Q值
  3.5  使用Python進行訓練
    3.5.1  運行程序
    3.5.2  說明程序
  3.6  基於OpenAI Gym的倒立擺
    3.6.1  運行程序
    3.6.2  說明程序
  3.7  如何保存和載入Q值
第4章  深度強化學習
  4.1  什麼是深度強化學習
  4.2  對於老鼠學習問題的應用
    4.2.1  運行程序
    4.2.2  說明程序
    4.2.3  如何保存和讀取智能體模型
  4.3  基於OpenAI Gym的倒立擺
    4.3.1  運行程序
    4.3.2  說明程序
  4.4  基於OpenAI Gym的太空侵略者
  4.5  基於OpenAI Gym的顛球
    4.5.1  運行程序
    4.5.2  說明程序
  4.6  對戰遊戲
    4.6.1  黑白棋
    4.6.2  訓練方法
    4.6.3  變更盤面
    4.6.4  黑白棋實體
    4.6.5  如何與人類對戰
    4.6.6  卷積神經網路的應用
  4.7  使用物理引擎進行模擬
    4.7.1  物理引擎
    4.7.2  運行程序
    4.7.3  說明程序
  4.8  物理引擎在顛球問題中的應用
  4.9  物理引擎在倒立擺問題中的應用
  4.10  物理引擎在機械臂問題中的應用
  4.11  使用其他深度強化學習方法
    4.11.1  深度強化學習的類型
    4.11.2  將訓練方法更改為DDQN
    4.11.3  將訓練方法更改為PER-DQN
    4.11.4  將訓練方法更改為DDPG
    4.11.5  將訓練方法更改為A3C
第5章  實際環境中的應用
  5.1  使用攝像機觀察環境(MNIST)
    5.1.1  攝像機設置
    5.1.2  通過卷積神經網路對攝像機圖像進行分類
    5.1.3  使用圖像大小為28×28的手寫數字進行訓練
  5.2  實際環境中的老鼠學習問題

  5.3  使用Raspberry Pi處理老鼠學習問題
    5.3.1  環境構建
    5.3.2  以輸入輸出為重點的簡化
    5.3.3  使用攝像機測量環境
  5.4  使用Arduino+PC處理老鼠學習問題
    5.4.1  環境構建
    5.4.2  以輸入輸出為重點的簡化
    5.4.3  使用攝像機測量環境
  5.5  使用Raspberry Pi+Arduino處理老鼠學習問題
  5.6  結語
附錄

  • 商品搜索:
  • | 高級搜索
首頁新手上路客服中心關於我們聯絡我們Top↑
Copyrightc 1999~2008 美商天龍國際圖書股份有限公司 臺灣分公司. All rights reserved.
營業地址:臺北市中正區重慶南路一段103號1F 105號1F-2F
讀者服務部電話:02-2381-2033 02-2381-1863 時間:週一-週五 10:00-17:00
 服務信箱:bookuu@69book.com 客戶、意見信箱:cs@69book.com
ICP證:浙B2-20060032