luchi007:CSDN认证博客专家
博客地址:https://luchi007.blog.csdn.net
luchi007:CSDN认证博客专家
博客地址:https://luchi007.blog.csdn.net
Online learning系列:从RDAFOBOS到FTRL
Reinforcement Learning强化学习系列之一:model-based learning
Online learning系列:从RDAFOBOS到FTRL
Reinforcement Learning强化学习系列之三:MC Control
Tensorflow的采样方法:candidate sampling
Reinforcement Learning强化学习系列之五:值近似方法Value Approximation
Reinforcement Learning强化学习系列之五:值近似方法Value Approximation
Reinforcement Learning强化学习系列之二:MC prediction
Reinforcement Learning强化学习系列之四:时序差分TD