幫助中心 | 我的帳號 | 關於我們
美商天龙图书网 搜索“学强” 共有 7 种商品

最近浏览的商品

请选择排序方式: 类别   版别    出版年月↓   折扣↓   定价↓

  • 基于Python的强化学习

  • 所属分类:电子电脑>>计算机技术>>程序与语言     作者:(美)安德里亚·隆萨|责编:刘炽|译者:刘继红//王瑞文     出版社:中国电力
  •     本书首先介绍在强化学 习环境中工作所需的工具、 库和设置,涵盖了强化学习 的构成模块,深入探讨基于 值的方法,如Q-learning和 SARSA算法的应用。读者将 学习如何结合使用Q- learning和神经网络来解决 复杂问题。此外,在学习 DDPG和TD3确定性算法之 前,读者将学习策略梯度方 法,如TRPO和PPO,以提 高性能和稳定性。本书还介 绍模仿学习的原理,以及 Dagger如何教智能体飞行 。读者将探索进化策略和黑 盒优化技术。最后,读者将 掌握探索方法,如UCB和 UCB1,并开发一个名为 ESBAS的元算法。 如果你是人工智能研究 者、深度学习用户,或者希 望从头开始学习强化学习的 人,那么这本书就很适合你 。如果你想了解该领域的进 展,也会发现这本书很有帮 助。当然,Python的基础知 识是必需的。
  • 人民币:RMB 88.00 元     售价:NT$ 352.00
  • 放入购物车
    加入收藏夹


  • 强化学习(原理与Python实战)/智能系统与技术丛书

  • 所属分类:电子电脑>>计算机技术>>程序与语言     作者:肖智清|责编:杨福川//李乐     出版社:机械工业
  • 丛书项:智能系统与技术丛书
  •     本书从原理和实战两个 方面介绍了强化学习。原理 方面,深入介绍了主流强化 学习理论和算法,覆盖资格 迹等经典算法和MuZero等 深度强化学习算法;实战方 面,每章都配套了编程案例 ,以方便读者学习。 全书从逻辑上分为三部 分。 第1章:从零开始介绍强 化学习的背景知识,介绍环 境库Gym的使用。 第2~15章:基于折扣奖 励离散时间Markov决策过 程模型,介绍强化学习的主 干理论和常见算法。采用数 学语言推导强化学习的基础 理论,进而在理论的基础上 讲解算法,并为算法提供配 套代码实现。基础理论的讲 解突出主干部分,算法讲解 全面覆盖主流的强化学习算 法,包括经典的非深度强化 学习算法和近年流行的强化 学习算法。Python实现和算 法讲解一一对应,还给出了 深度强化学习算法的 TensorFlow和PyTorch对照 实现。 第16章:介绍其他强化 学习模型,包括平均奖励模 型、连续时间模型、非齐次 模型、半Markov模型、部 分可观测模型等,以便更好 地了解强化学习研究的全貌 。
  • 人民币:RMB 129.00 元     售价:NT$ 516.00
  • 放入购物车
    加入收藏夹




  • 商品搜寻:
  • | 进阶搜寻
首页新手上路客服中心关于我们人才邀请联络我们Top↑
Copyrightc 1999~2008 美商天龙国际图书股份有限公司 台湾分公司. All rights reserved.
营业地址:台北市中正区重庆南路一段103号1F 105号1F-2F
读者服务部电话:02-2381-2033 02-2381-1863 时间:周一~周五 10:00~17:00 服务信箱:bookuu@69book.com