美商天龙图书网

强化学习基础原理与应用
所属分类：电子电脑>>计算机技术>>程序与语言作者：编者:张百珂|责编:魏莹出版社：清华大学
本书循序渐进地讲解了使用Python语言实现强化学习的核心算法开发的知识，内容涵盖了数据处理、算法、大模型等知识，并通过具体实例的实现过程演练了各个知识点的使用方法和使用流程。《强化学习基础、原理与应用》共分为17章，主要内容包括强化学习基础、马尔可夫决策过程、蒙特卡洛方法、Q-learning与贝尔曼方程、时序差分学习和 SARSA算法、DQN算法、 DDQN算法、竞争DQN算法、REINFORCE算法、 Actor-Critic算法、PPO算法、TRPO算法、连续动作空间的强化学习、值分布式算法、基于模型的强化学习、多智能体强化学习实战： Predator-Prey游戏及自动驾驶系统。本书内容简洁而不失技术深度，以极简的文字介绍了复杂的案例，易于阅读和理解。本书适用于已经了解 Python语言基础语法的读者，想进一步学习强化学习、机器学习、深度学习及相关技术的读者，还可作为大专院校相关专业的师生用书和培训机构的教材使用。
人民幣：RMB 99.00 元售价：NT$ 396.00 元

增强现实(原理与实践)/计算机科学丛书
所属分类：电子电脑>>计算机技术>>信息处理与专用数据库作者：(奥)迪特尔·施马尔斯蒂格//(美)托比亚斯·霍勒尔|责编:唐晓琳|译者:刘越出版社：机械工业
丛书项：计算机科学丛书
随着真实世界中计算机生成的信息越来越多，增强现实（AR）可以通过不可思议的方式增强人类的感知能力。这个快速发展的领域要求学习者掌握多学科知识，包括计算机视觉、计算机图形学、人机交互等。本书将这些知识有机融合，严谨且准确地展现了当前最具影响力的增强现实技术和应用。全书从技术、方法论和用户的角度全面讲解相关知识，实现了理论与实践的平衡，适合开发者、高校师生和研究者阅读。
人民幣：RMB 99.00 元售价：NT$ 396.00 元

强化学习(原理与Python实战)/智能系统与技术丛书
所属分类：电子电脑>>计算机技术>>程序与语言作者：肖智清|责编:杨福川//李乐出版社：机械工业
丛书项：智能系统与技术丛书
本书从原理和实战两个方面介绍了强化学习。原理方面，深入介绍了主流强化学习理论和算法，覆盖资格迹等经典算法和MuZero等深度强化学习算法；实战方面，每章都配套了编程案例，以方便读者学习。全书从逻辑上分为三部分。第1章：从零开始介绍强化学习的背景知识，介绍环境库Gym的使用。第2～15章：基于折扣奖励离散时间Markov决策过程模型，介绍强化学习的主干理论和常见算法。采用数学语言推导强化学习的基础理论，进而在理论的基础上讲解算法，并为算法提供配套代码实现。基础理论的讲解突出主干部分，算法讲解全面覆盖主流的强化学习算法，包括经典的非深度强化学习算法和近年流行的强化学习算法。Python实现和算法讲解一一对应，还给出了深度强化学习算法的 TensorFlow和PyTorch对照实现。第16章：介绍其他强化学习模型，包括平均奖励模型、连续时间模型、非齐次模型、半Markov模型、部分可观测模型等，以便更好地了解强化学习研究的全貌。
人民幣：RMB 129.00 元售价：NT$ 516.00 元

强化学习(原理与Python实现)/智能系统与技术丛书
所属分类：电子电脑>>计算机技术>>程序与语言作者：肖智清出版社：机械工业
丛书项：智能系统与技术丛书
本书理论完备，涵盖主流经典强化学习算法和深度强化学习算法；实战性强，基于Python、Gym、 TensorFlow 2、AlphaZero等构建，配套代码与综合案例。全书共12章，主要内容如下。第1章：介绍强化学习的基础知识与强化学习环境库Gym的使用，并给出完整的编程实例。第2～9章：介绍强化学习的理论知识。以Markov 决策过程为基础模型，覆盖了所有主流强化学习理论和算法，包括资格迹等经典算法和深度确定性梯度策略等深度强化学习算法。所有章节都提供了与算法配套的Python程序，使读者完全掌握强化学习算法的原理与应用。第10～12章：介绍了多个热门综合案例，包括电动游戏、棋盘游戏和自动驾驶。算法部分涵盖了在《自然》《科学》等权威期刊上发表的多个深度强化学习明星算法。
人民幣：RMB 89.00 元售价：NT$ 356.00 元

深度强化学习(基于Python的理论及实践英文版)/经典原版书库
所属分类：电子电脑>>计算机技术>>程序与语言作者：(美)劳拉·格雷泽//龚辉伦|责编:唐晓琳出版社：机械工业
丛书项：经典原版书库
深度强化学习结合了深度学习和强化学习，使人工智能体能够在没有监督的情况下学习如何解决顺序决策问题。在过去的十年中，深度强化学习在一系列问题上取得了显著的成果，涵盖从单机游戏和多人游戏到机器人技术等方方面面。本书采用理论结合实践的方法，从直觉开始，然后仔细解释深度强化学习算法的理论，讨论在配套软件库SLMLab中的实现，最后呈现深度强化学习算法的实践细节。
人民幣：RMB 119.00 元售价：NT$ 476.00 元

最近浏覽的商品