GitHub萬星資源：強化學習算法實現(xiàn)，教程代碼學習規(guī)劃全都有

作者：魚羊 2019-08-12 08:43:53

自從有了強化學習（RL），AI上能星際爭霸，下能雅達利稱王，讓內(nèi)行人沉醉，讓外行人驚奇。

本文經(jīng)AI新媒體量子位（公眾號ID:QbitAI）授權轉(zhuǎn)載，轉(zhuǎn)載請聯(lián)系出處。

自從有了強化學習（RL），AI上能星際爭霸，下能雅達利稱王，讓內(nèi)行人沉醉，讓外行人驚奇。

這里恰有一份標星過萬的強化學習資源，既有教程推薦，又有配套練習，網(wǎng)友學了都說好，并且還在實時更新。

入學要求并不高，只需要一些基礎的數(shù)學和機器學習知識。

清晰的學習路徑

想要入門強化學習，一份優(yōu)質(zhì)的課程必不可少。

強化學習資源千千萬，項目作者 Denny Britz 大力推薦這兩個：

David Silver 的強化學習課程：

http://www0.cs.ucl.ac.uk/staff/d.silver/web/Teaching.html

以及 Richard Sutton 和 Andrew Barto的《強化學習：簡介（第二版）》：

http://incompleteideas.net/book/RLbook2018.pdf

p.s. 實測無需魔法

Denny Britz 小哥表示，這兩本書幾乎涵蓋了入門強化學習需要了解的大部分研究論文，基礎決定高度，理論知識還是要扎扎實實學起來。

理論有了，可書里并沒有算法實現(xiàn)。

別擔心，幫人幫到底，送佛送到西，Denny Britz 親自動手，用 Python，OpenAI Gym 和 Tensorflow 實現(xiàn)了大多數(shù)標準強化算法，并把它們都共享了出來，方便大家配合教材食用。

簡直太貼心。

在這份萬星資源里，每個文件夾都對應著教材的一個或多個章節(jié)。除了練習和解決方案之外，每個文件夾下還包含了一系列學習目標，基礎概念摘要，以及相關鏈接。

以基于模型的強化學習：使用動態(tài)規(guī)劃的策略迭代和值迭代這一章為例。

這一章配套的是 David Silver RL課程的第三講，動態(tài)編程規(guī)劃。

首先是學習目標：

設定好學習目標，這份教程還替你劃了重點概念。

最后，奉上實戰(zhàn)演練。

大框架已經(jīng)搭好，只需專注重點思考如何填空：

文后附標準答案：

這份教程現(xiàn)在涵蓋了以下算法實現(xiàn)。

學習路徑如此清晰，這樣的優(yōu)質(zhì)資源，不Mark一下嗎？

傳送門：

https://github.com/dennybritz/reinforcement-learning

責任編輯：張燕妮來源：量子位