并行深度强化学习

Posted

技术标签:

【中文标题】并行深度强化学习【英文标题】:parallelized deep reinforcement learning 【发布时间】:2022-01-17 06:55:18 【问题描述】:

我尝试在低速环境中运行 DRL,而顺序学习让我感到不安。有没有办法加快学习过程?我尝试了一些离线深度强化学习,但我仍然需要更高的速度(如果可能的话)。

【问题讨论】:

三种方法,你可以,A) 获得更好的硬件 B) 编写更好的软件或 C) 做更好的数据科学并选择更少的功能。 【参考方案1】:

您正在寻找Vectorized Environments。它们将允许与您的环境进行并行交互。

【讨论】:

谢谢@tnfru,我也了解了 A3C,那么 A3C 与矢量化 env 有何不同? A3C 是一种无模型算法。这与使用矢量化环境无关。

以上是关于并行深度强化学习的主要内容,如果未能解决你的问题,请参考以下文章

深度强化学习与深度Q网络

深度学习和深度强化学习的区别

深度学习+强化学习=深度强化学习

海云译见 | 深度学习最新进展:“IMPALA”深度强化多任务学习架构

深度强化学习技术概述

深度强化学习技术概述