强化学习入门·

Posted cathy_mu

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了强化学习入门·相关的知识,希望对你有一定的参考价值。

源地址 http://blog.csdn.net/supercally/article/details/54754787

2. 增强学习都有哪些策略

蒙特卡洛方法

简单而言,蒙特卡洛方法就是对这个策略所有可能的结果求平均。我们向前走了以后,再做一个action,根据这个式子,直到episode结束,求出收益的和,就是向前走这个动作的一个采样。我们再不断地在这个状态采样,然后来求平均。等到采样变得非常非常多的时候,我们的统计值就接近期望值了。所以蒙特卡洛方法是一个非常暴力,非常直观的方法。

以上是关于强化学习入门·的主要内容,如果未能解决你的问题,请参考以下文章

轻松入门强化学习的一本新书《Easy RL 强化学习教程》

多智能体强化学习入门

强化学习——入门

强化学习入门级实践教学

《深入浅出强化学习:原理入门_郭宪方勇纯》高清PDF+源代码

强化学习入门