米老虎M:
博客地址:https://www.cnblogs.com/milaohu/
增强学习笔记 第十章 On-Policy控制的近似 增强学习笔记 第八章 表格类方法的规划与学习 增强学习笔记 第九章 On-Policy预测的近似 增强学习笔记 第六章 TD方法 增强学习笔记 第五章 蒙特卡洛方法 增强学习笔记 第四章 动态规划 拉格朗日乘子 PRML中文版(马春鹏)勘误表 贝叶斯统计的问题描述 Kalman Filter的数学推导
增强学习笔记 第十章 On-Policy控制的近似
增强学习笔记 第八章 表格类方法的规划与学习
增强学习笔记 第九章 On-Policy预测的近似
增强学习笔记 第六章 TD方法
增强学习笔记 第五章 蒙特卡洛方法
增强学习笔记 第四章 动态规划
拉格朗日乘子
PRML中文版(马春鹏)勘误表
贝叶斯统计的问题描述
Kalman Filter的数学推导