DQN(Deep Q-learning)入门教程(结束)之总结
Posted xiaohuiduan
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了DQN(Deep Q-learning)入门教程(结束)之总结相关的知识,希望对你有一定的参考价值。
emm,花了一周时间完成了DQN的从入门到入土,这个系列是完完全全的入门系列,因为讲的内容很简单,内容也比较少,仅仅是一个最基本的介绍。
我也是因为偶然的原因才接触到强化学习,然后觉得很有意思,比较好奇它是怎么做到的,于是就花了一段时间去了解,接着就将自己的入门过程就写下来了。
这个系列相比较与数据挖掘系列的博客,内容还是比较少的,内容如下所示:
- DQN(Deep Q-learning)入门教程(零)之教程介绍
- DQN(Deep Q-learning)入门教程(一)之强化学习介绍
- DQN(Deep Q-learning)入门教程(二)之最优选择
- DQN(Deep Q-learning)入门教程(三)之蒙特卡罗法算法与Q-learning算法
- DQN(Deep Q-learning)入门教程(四)之Q-learning Play Flappy Bird
- DQN(Deep Q-learning)入门教程(五)之DQN介绍
- DQN(Deep Q-learning)入门教程(六)之DQN Play Flappy-bird ,MountainCar
说实话,以6篇博客想来学懂DQN(或者强化学习)是远远不够的,一来,篇幅不够;二来,自己的水平也不够。我仅仅是个初学者,又怎么可能有能力将其讲得广阔而透彻呢?因此,这个系列也仅仅是一个入门系列,最基本的入门。
不过,如果我们对某一个东西有兴趣的话,学习起来也就会事倍功半。它能够站在后面驱使着我们去学习。在个人看来,机器学习本身就是一个好玩的东西(尽管掉了一堆头发,是真的一堆头发,我妈打扫房间的时候还吐槽我怎么掉了这么多头发,/(ㄒoㄒ)/~~),如何进行加快模型的收敛,如何提取有用的信息,如何构建一个好的模型,这些都是值得研究,并且很有意思的东西。我还依稀的记得,当我了解到神经网络总的MP模型的时候,我直接惊呆了,为模型之简介感到惊叹。
这个系列的博客实际上我是写的匆匆忙忙,只花了约一周的时间就写完了。实际上如果我时间很多的话,至少这个系列的博客不会低于15篇,但是,说实话我不敢这样去写。因为我需要考研了,如果写15篇的话,那至少得需要近2个月的时间,这样势必会耽误我的复习,因此也只能这样了。如果我考研能够成功上岸的话,那么我将会更加深入地去了解强化学习以及其优化方法,毕竟那时候时间应该会挺多的。总的来说,还是比较遗憾,无法将这个系列深入学习和写下去。
接下来一段时间,如果没有特殊情况,我基本不会再去写博客,也不会对博客进行更新,如果大家想更加深入的去了解强学习,推荐大家可以去看看:
以上是关于DQN(Deep Q-learning)入门教程(结束)之总结的主要内容,如果未能解决你的问题,请参考以下文章
DQN(Deep Q-learning)入门教程(结束)之总结
DQN(Deep Q-learning)入门教程(结束)之总结
DQN(Deep Q-learning)入门教程(零)之教程介绍