论文笔记之:Dueling Network Architectures for Deep Reinforcement Learning
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了论文笔记之:Dueling Network Architectures for Deep Reinforcement Learning相关的知识,希望对你有一定的参考价值。
Dueling Network Architectures for Deep Reinforcement Learning
ICML 2016 Best Paper
Google DeepMind
- Abstract:
本文是 ICML 2016 的最佳论文之一,又是出自 Google DeepMind。
最近几年,在 reinforcement learning 上关于 deep representation 有取得了很大的成功。然而,许多这些应用都是利用传统的网络架构,例如:神经网络,LSTMs,或者 Auto-encoders。本文提出了一种新的网络结构来处理 model-free reinforcement learning。所提出的 dueling network 表示两个独立的预测:
one for the state value function ;
one for the state-dependent action advantage function。
这种分解方式的主要优势在于:generalize learning across actions without imposing any change to the underlying reinforcement learning algorithm. (产生学习交叉动作,而又没有对潜在的RL做出任何改变)。实验表明,当出现许多相似值的动作时,可以学习到更好的策略评价。此外,在玩 Atari 2600 时取得了比 Nature 那个更好的效果。
以上是关于论文笔记之:Dueling Network Architectures for Deep Reinforcement Learning的主要内容,如果未能解决你的问题,请参考以下文章
论文阅读笔记之——《PVNet: Pixel-wise Voting Network for 6DoF Pose Estimation》
(pytorch复现)基于深度强化学习(CNN+dueling network/DQN/DDQN/D3QN/PER)的自适应车间调度(JSP)
(pytorch复现)基于深度强化学习(CNN+dueling network/DQN/DDQN/D3QN)的自适应车间调度(JSP)
(pytorch复现)基于深度强化学习(CNN+dueling network/DQN/DDQN/D3QN)的自适应车间调度(JSP)
[论文阅读笔记] Adversarial Mutual Information Learning for Network Embedding