我将带头强化学习!

Posted Datawhale

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了我将带头强化学习!相关的知识,希望对你有一定的参考价值。

卷友们好,我是rumor。

我一直是一个文字型学习者,具体什么意思呢,就是我在听任何课时,注意力都集中不到半小时

大学的时候我们老师很爱写板书,还很爱考课上的习题,但无论我怎么努力,都会有那么一刻灵魂出窍,然后就再也跟不上了。于是我干脆弃疗,良心不安的时候老师在上面讲我在底下自学,没有良心的时候就白天上课刷手机,晚上再自习补课。

于是长期下来我养成了快速自学的能力,看书看论文都比较快,还爱整理成笔记。

但我依旧有很多想学的东西没有学,比如多模态,比如强化学习。最近看到的谷歌和OpenAI的一些前沿的研究,都在用强化学习去训练大模型了,这是我认为走向通用人工智能的必备技术之一

我有好几次想开始强化学习,甚至已经在B站收藏了李宏毅老师的公开课,甚至在下班回家的出租车上点了播放,然而我还是没有撑过policy gradient就神游太虚了。

直到Datawhale给我发来这个:

我感觉我的强化学习之路终于要开始了!

目前已经开始看了,等学完之后准备写个长文,先分享几个我觉得很赞的点吧:

  1. 这本书是来自中科院、北大、清华的硕士大佬同学出品的,从他们的角度去写,更能懂现在初学者困惑的一些点

  2. 这本书综合了李宏毅、周博磊、李科浇三个老师热门网课的内容,非常全面

  3. 这本书,它不是很厚!!! 这一点对初学者真的太重要了,要知道我这么多年从来没把花书啃完过

那先写到这里了,不能耽误自己学习。


大家好我是rumor

一个热爱技术,有一点点幽默的妹子

欢迎关注我

带你学习带你肝

一起在人工智能时代旋转跳跃眨巴眼

后台回复 强化学习,加入一起学习

「我要两周啃完这本书!」

以上是关于我将带头强化学习!的主要内容,如果未能解决你的问题,请参考以下文章

深度强化学习 - CartPole 问题

如何更新 keras 中的权重以进行强化学习?

强化学习的基本迭代方法

代码集合深度强化学习Pytorch实现集锦

强化学习(使用 TensorFlow 和 Matlab 环境)

强化学习70年演进:从精确动态规划到基于模型