强化学习
Posted think90
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了强化学习相关的知识,希望对你有一定的参考价值。
-
简介
-
Q-learning
-
Sarsa
-
Deep Q Network
-
Policy Gradient
-
Actor Critic
- 6.1 什么是 Actor Critic
- 6.2 Actor Critic (Tensorflow)
- 6.3 什么是 Deep Deterministic Policy Gradient (DDPG)
- 6.4 Deep Deterministic Policy Gradient (DDPG) (Tensorflow)
- 6.5 什么是 Asynchronous Advantage Actor-Critic (A3C)
- 6.6 Asynchronous Advantage Actor-Critic (A3C) (Tensorflow)
- 6.7 Distributed Proximal Policy Optimization (DPPO) (Tensorflow)
-
Model Based RL
以上是关于强化学习的主要内容,如果未能解决你的问题,请参考以下文章