增强学习--TRPO算法

Posted buyizhiyou

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了增强学习--TRPO算法相关的知识,希望对你有一定的参考价值。

理论部分参考

代码

以上是关于增强学习--TRPO算法的主要内容,如果未能解决你的问题,请参考以下文章

增强学习Reinforcement Learning经典算法梳理1:policy and value iteration

增强学习 ----- 基本概念

GBDT 简述

增强学习的基本概念

增强学习贪心算法与Softmax算法

增强学习Reinforcement Learning经典算法梳理3:TD方法