强化学习教程来啦！贡献者来自中科院清华北大3位男神！

Posted 2021-05-25 Datawhale

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了强化学习教程来啦！贡献者来自中科院清华北大3位男神！相关的知识，希望对你有一定的参考价值。

↑↑↑关注后"星标"Datawhale

每日干货 & 每月组队学习，不错过

Datawhale开源

核心贡献者：王琦、杨毅远、江季

导读

半年前，Datawhale开源项目《Easy-RL》（原《李宏毅深度强化学习笔记》）发布，受到全网转发，半年后，《Easy-RL》在原有的基础上进行了迭代优化，帮助读者轻松入门强化学习。

关于本书

《Easy-RL》由开源组织 Datawhale 发起，由中科院王琦、清华大学杨毅远、北京大学江季三位组织成员主要负责。本书结合了李宏毅老师的《深度强化学习》、周博磊老师的《强化学习纲要》、李科浇老师的《百度强化学习》等多个强化学习的经典资料，并配有相关的习题、面经以及完全版的代码实战，适合想入门强化学习的小伙伴。

项目开源地址：

https://github.com/datawhalechina/easy-rl

2020 年 11 月 22 日，《Easy-RL》（原《李宏毅深度强化学习笔记》）在github中正式发布，截至今日，已收获1.7k个Star，并受到了广大学习者的一致好评，学习者纷纷表示通过这个教程收获颇多。编写者们也通过读者反馈的建议，对教程进行了实时地更新与补充。

本书细节

时隔半年，《Easy-RL》在原有的基础上进行了充分地迭代和优化，不仅对发布时已有章节进行了完善和纠错，同时还补充了常见的面试题，当然，项目作者还给出了完全版的强化学习实战代码，方便大家深入学习。

1.教程案例

案例1: 对 Policy 概念的解析

案例2: 利用简单的例子解释强化学习基本概念

案例3: AlphaStar 论文解读

2.教程习题

案例: RL的面试真题

3.实践优化

首先是增加了一些更为高级且研究工程上常用的算法，比如TD3，Soft-Actor-Critic等等，新版所有算法实现如下表：

此外在每个算法目录下会有相关的算法实现说明：

并且代码将更加简洁，结构清晰，具体可以去github上细看，此外为了更好地呈现结果，增加了jupyter notebook来训练，可以在网页直接查看结果，同时也说明outputs文件夹下生成的结果是童叟无欺的，如下：

以上就是代码相关的主要优化，不止如此，今后除了修缮代码结构注释等等，还会增加各种各样的DQN比如rainbow-dqn等代码，以及各种算法对于同一环境的实现对比，敬请期待。

Easy-RL目录

本书电子版可通过在Datawhale公众号后台回复「强化学习」获取。

“为开源点赞三连↓

以上是关于强化学习教程来啦！贡献者来自中科院清华北大3位男神！的主要内容，如果未能解决你的问题，请参考以下文章

麻省北大清华等顶尖高校与企业 20 位强化学习专家齐聚，RLChina 2021 强化学习暑期课免费报名啦！

麻省北大清华等顶尖高校与企业 20 位强化学习专家齐聚，RLChina 2021 强化学习暑期课免费报名啦！...

麻省北大清华等顶尖高校与企业 20 位强化学习专家齐聚，RLChina 2021 强化学习暑期课免费报名啦！...

李远志为清华姚班蝉联斯隆奖！北大唐云清和中科大田小川同期加冕

深度学习在图像处理的应用一览

推荐｜深度学习PyTorch的教程代码