Reinforcement Learning强化学习系列之三：MC Control

Posted 2023-03-01 luchi007

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了Reinforcement Learning强化学习系列之三：MC Control相关的知识，希望对你有一定的参考价值。

引言

前面一篇文章中说到了MC prediction，主要介绍的是如何利用采样轨迹的方法计算Value函数，但是在强化学习中，我们主要想学习的是Q函数，也就是计算出每个state对应的action以及其reward值，在这篇文章中，将会介绍。

MC control with epsilon-greedy

这一部分将会介绍基于 ϵ−

以上是关于Reinforcement Learning强化学习系列之三：MC Control的主要内容，如果未能解决你的问题，请参考以下文章

强化学习专栏——Reinforcement Learning

强化学习 Reinforcement Learning

Reinforcement Learning强化学习系列之一：model-based learning

强化学习 (Reinforcement Learning)

干货总结| Deep Reinforcement Learning 深度强化学习

Reinforcement Learning强化学习系列之三：MC Control