总结一下自己入坑强化学习的经验。
在入坑之前,自己对强化学习基本一无所知,所以对于强化学习的学习基本上是从零开始。
下面总结一下自己学习强化学习所看的网课,教材,论文,代码
网课
- 莫烦的强化学习教程。这个教程真的是通俗易懂,完全针对初学者,也有配套的代码。不过讲解的内容不是很深。快速看一遍就行,形成对强化学习的一个基本认识。他的代码是tensorflow的,我还是更喜欢Pytorch一些。
- David Silver的课程。这个课程不算有难度,从MDP开始讲也是最适合初学者的,看完之后基本对强化学习的整个体系有了清晰的认知。这门课的侧重点还是传统强化学习的基本理论和概念,也是非看不可的课程。
- 李宏毅的强化学习课程 这门课基本上就是对DRL几个算法的具体介绍,可以作为一个补充看一下,不是非看不可。
- cs294|cs285 这门课应该是非看不可的课,也是一门有难度的课,课程网站上也有相应的project可以做。内容上偏重policy gradient。建议看完David Silver的课程之后再看。
教材
论文
论文基础部分就是看openAI 提供的key papers
入门的话就是看一下第一部分Model free 的前a,b,c小结的17篇文章。
代码
GitHub 上有很多优秀的强化学习论文的代码。个人建议是使用pytorch ,因为代码更容易阅读,对初学者也更友好。下面列两个自己看的。
代码基本作为阅读学习使用。基本没有包含trick。
完成上面相关内容的学习,基本就算是入门了,入门之后就全靠自己去学习,去探索了。
强化学习入坑总结
原文:https://www.cnblogs.com/Lzqayx/p/12122160.html