阿里開源Gym StarCraft 能幫助開發者體驗強化學習
星際爭霸一直是游戲玩家心目中即時戰略類的經典之作,歷時十多年而不衰。而如今它更成為深度強化學習、人工智能算法研究的一個主要平臺和工具。因為其蘊含了多智能體協作、多任務學習、宏觀策略規劃等復雜問題,一旦取得部分突破和進展,對商業和社會發展都會帶來極大影響。如國外的DeepMind、Facebook等公司相繼投入大量人力基于它進行通用人工智能的研究。
在星際爭霸的AI研究中,一直以來缺乏完善的工具鏈和開發環境。今年年初Facebook公司發布的TorchCraft打通了星際和Torch之間的橋梁,但卻不支持主流的Python開發語言和TensorFlow深度學習框架;早前OpenAI公司發布的Gym算法平臺雖然支持眾多游戲環境下的算法驗證和對比測試,但卻缺少對星際的支持。
阿里巴巴作為國內領先的大數據、云計算公司,對以強化學習為代表的人工智能技術密切關注并投入巨大。針對星際AI的這一現狀,率先開發了一套專業易用的研究平臺Gym StarCraft,并且已經開源:https://github.com/deepcraft/gym-starcraft。
在Gym StarCraft中,AI和強化學習研究者可以非常方便地使用Python語言來進行深度強化學習智能Agent的開發,它底層完成了對TorchCraft和OpenAI Gym的封裝,支持基于TensorFlow和Keras等主流算法框架進行開發,僅需幾十行代碼即可完成一個基本的智能Agent的開發。同時,便于評測智能Agent的有效性,Gym StarCraft被集成在了OpenAI Gym這一主流的強化學習AI評測平臺中,支持世界各地的星際AI研究者基于它去進行公平、快捷的效果評估,為廣大開發者提供了一個人工智能的開放協作研究平臺。對于強化學習的普及和推廣起著關鍵性作用。