我将带头强化学习!
Posted Datawhale
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了我将带头强化学习!相关的知识,希望对你有一定的参考价值。
卷友们好,我是rumor。
我一直是一个文字型学习者,具体什么意思呢,就是我在听任何课时,注意力都集中不到半小时。
大学的时候我们老师很爱写板书,还很爱考课上的习题,但无论我怎么努力,都会有那么一刻灵魂出窍,然后就再也跟不上了。于是我干脆弃疗,良心不安的时候老师在上面讲我在底下自学,没有良心的时候就白天上课刷手机,晚上再自习补课。
于是长期下来我养成了快速自学的能力,看书看论文都比较快,还爱整理成笔记。
但我依旧有很多想学的东西没有学,比如多模态,比如强化学习。最近看到的谷歌和OpenAI的一些前沿的研究,都在用强化学习去训练大模型了,这是我认为走向通用人工智能的必备技术之一。
我有好几次想开始强化学习,甚至已经在B站收藏了李宏毅老师的公开课,甚至在下班回家的出租车上点了播放,然而我还是没有撑过policy gradient就神游太虚了。
直到Datawhale给我发来这个:

我感觉我的强化学习之路终于要开始了!
目前已经开始看了,等学完之后准备写个长文,先分享几个我觉得很赞的点吧:
这本书是来自中科院、北大、清华的硕士大佬同学出品的,从他们的角度去写,更能懂现在初学者困惑的一些点
这本书综合了李宏毅、周博磊、李科浇三个老师热门网课的内容,非常全面
这本书,它不是很厚!!! 这一点对初学者真的太重要了,要知道我这么多年从来没把花书啃完过
那先写到这里了,不能耽误自己学习。

大家好我是rumor
一个热爱技术,有一点点幽默的妹子
欢迎关注我
带你学习带你肝
一起在人工智能时代旋转跳跃眨巴眼
后台回复 强化学习,加入一起学习
「我要两周啃完这本书!」
以上是关于我将带头强化学习!的主要内容,如果未能解决你的问题,请参考以下文章