论文笔记之：Dueling Network Architectures for Deep Reinforcement Learning

Posted 2020-07-28

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了论文笔记之：Dueling Network Architectures for Deep Reinforcement Learning相关的知识，希望对你有一定的参考价值。

Dueling Network Architectures for Deep Reinforcement Learning

ICML 2016 Best Paper

Google DeepMind

Abstract:

　　本文是 ICML 2016 的最佳论文之一，又是出自 Google DeepMind。

　　最近几年，在 reinforcement learning 上关于 deep representation 有取得了很大的成功。然而，许多这些应用都是利用传统的网络架构，例如：神经网络，LSTMs，或者 Auto-encoders。本文提出了一种新的网络结构来处理 model-free reinforcement learning。所提出的 dueling network 表示两个独立的预测：

　　one for the state value function ;

　　one for the state-dependent action advantage function。

　　这种分解方式的主要优势在于：generalize learning across actions without imposing any change to the underlying reinforcement learning algorithm. （产生学习交叉动作，而又没有对潜在的RL做出任何改变）。实验表明，当出现许多相似值的动作时，可以学习到更好的策略评价。此外，在玩 Atari 2600 时取得了比 Nature 那个更好的效果。

技术分享

以上是关于论文笔记之：Dueling Network Architectures for Deep Reinforcement Learning的主要内容，如果未能解决你的问题，请参考以下文章

论文阅读笔记之——《PVNet: Pixel-wise Voting Network for 6DoF Pose Estimation》

（pytorch复现）基于深度强化学习（CNN+dueling network/DQN/DDQN/D3QN/PER）的自适应车间调度(JSP)

（pytorch复现）基于深度强化学习（CNN+dueling network/DQN/DDQN/D3QN）的自适应车间调度(JSP)

深度强化学习-Dueling DQN算法原理与代码

[论文阅读笔记] Adversarial Mutual Information Learning for Network Embedding