幫助中心 | 我的帳號 | 關於我們
请选择排序方式: 类别   版别    出版年月↓   折扣↓   定价↓
  • 强化学习基础原理与应用

  • 所属分类:电子电脑>>计算机技术>>程序与语言     作者:编者:张百珂|责编:魏莹     出版社:清华大学
  •     本书循序渐进地讲解了 使用Python语言实现强化学 习的核心算法开发的知识, 内容涵盖了数据处理、算法 、大模型等知识,并通过具 体实例的实现过程演练了各 个知识点的使用方法和使用 流程。《强化学习基础、原 理与应用》共分为17章,主 要内容包括强化学习基础、 马尔可夫决策过程、蒙特卡 洛方法、Q-learning与贝尔 曼方程、时序差分学习和 SARSA算法、DQN算法、 DDQN算法、竞争DQN算法 、REINFORCE算法、 Actor-Critic算法、PPO算法 、TRPO算法、连续动作空 间的强化学习、值分布式算 法、基于模型的强化学习、 多智能体强化学习实战: Predator-Prey游戏及自动驾 驶系统。本书内容简洁而不 失技术深度,以极简的文字 介绍了复杂的案例,易于阅 读和理解。 本书适用于已经了解 Python语言基础语法的读者 ,想进一步学习强化学习、 机器学习、深度学习及相关 技术的读者,还可作为大专 院校相关专业的师生用书和 培训机构的教材使用。
  • 人民幣:RMB 99.00 元     售价:NT$ 396.00
  • 放入購物車
    加入收藏夾


  • 强化学习(原理与Python实战)/智能系统与技术丛书

  • 所属分类:电子电脑>>计算机技术>>程序与语言     作者:肖智清|责编:杨福川//李乐     出版社:机械工业
  • 丛书项:智能系统与技术丛书
  •     本书从原理和实战两个 方面介绍了强化学习。原理 方面,深入介绍了主流强化 学习理论和算法,覆盖资格 迹等经典算法和MuZero等 深度强化学习算法;实战方 面,每章都配套了编程案例 ,以方便读者学习。 全书从逻辑上分为三部 分。 第1章:从零开始介绍强 化学习的背景知识,介绍环 境库Gym的使用。 第2~15章:基于折扣奖 励离散时间Markov决策过 程模型,介绍强化学习的主 干理论和常见算法。采用数 学语言推导强化学习的基础 理论,进而在理论的基础上 讲解算法,并为算法提供配 套代码实现。基础理论的讲 解突出主干部分,算法讲解 全面覆盖主流的强化学习算 法,包括经典的非深度强化 学习算法和近年流行的强化 学习算法。Python实现和算 法讲解一一对应,还给出了 深度强化学习算法的 TensorFlow和PyTorch对照 实现。 第16章:介绍其他强化 学习模型,包括平均奖励模 型、连续时间模型、非齐次 模型、半Markov模型、部 分可观测模型等,以便更好 地了解强化学习研究的全貌 。
  • 人民幣:RMB 129.00 元     售价:NT$ 516.00
  • 放入購物車
    加入收藏夾

  • 强化学习(原理与Python实现)/智能系统与技术丛书

  • 所属分类:电子电脑>>计算机技术>>程序与语言     作者:肖智清     出版社:机械工业
  • 丛书项:智能系统与技术丛书
  •     本书理论完备,涵盖主流经典强化学习算法和深 度强化学习算法;实战性强,基于Python、Gym、 TensorFlow 2、AlphaZero等构建,配套代码与综合案 例。全书共12章,主要内容如下。 第1章:介绍强化学习的基础知识与强化学习环境 库Gym的使用,并给出完整的编程实例。 第2~9章:介绍强化学习的理论知识。以Markov 决策过程为基础模型,覆盖了所有主流强化学习理论 和算法,包括资格迹等经典算法和深度确定性梯度策 略等深度强化学习算法。所有章节都提供了与算法配 套的Python程序,使读者完全掌握强化学习算法的原 理与应用。 第10~12章:介绍了多个热门综合案例,包括电 动游戏、棋盘游戏和自动驾驶。算法部分涵盖了在《 自然》《科学》等权威期刊上发表的多个深度强化学 习明星算法。
  • 人民幣:RMB 89.00 元     售价:NT$ 356.00
  • 放入購物車
    加入收藏夾


  • 商品搜寻:
  • | 进阶搜寻
首页新手上路客服中心关于我们人才邀请联络我们Top↑
Copyrightc 1999~2008 美商天龙国际图书股份有限公司 台湾分公司. All rights reserved.
营业地址:台北市中正区重庆南路一段103号1F 105号1F-2F
读者服务部电话:02-2381-2033 02-2381-1863 时间:周一~周五 10:00~17:00 服务信箱:bookuu@69book.com