DeepTraffic:MIT模擬游戲利用深度學(xué)習(xí)來(lái)緩解交通擁堵
被堵在路上是個(gè)又喪又費(fèi)錢的事兒,除了讓人頭疼還可能導(dǎo)致錯(cuò)過(guò)約炮,交通堵塞使美國(guó)司機(jī)每年多花3000億。
研究人員認(rèn)為即使是少數(shù)的自動(dòng)駕駛車也將會(huì)大大改善交通流。 Lex Fridman和他在MIT的團(tuán)隊(duì)創(chuàng)造了一個(gè)游戲,來(lái)加速實(shí)現(xiàn)這個(gè)設(shè)想。
Deep Traffic模擬典型的高速公路環(huán)境,其玩家使用深度學(xué)習(xí)來(lái)控制自己的汽車。該模擬使初學(xué)者對(duì)復(fù)雜的技術(shù)概念易于上手,而游戲化推動(dòng)了專家開(kāi)發(fā)全新的技術(shù)。
使用神經(jīng)網(wǎng)絡(luò)的交通模擬游戲
想象你在洛杉磯一個(gè)繁忙的高速公路上開(kāi)車。您必須決定跟車距離,何時(shí)更換車道,以及如何在導(dǎo)航時(shí)避免撞到其他車輛。這就是所謂的路徑規(guī)劃。 有了Deep Traffic,任何人都可以設(shè)計(jì)和訓(xùn)練一個(gè)深度神經(jīng)網(wǎng)絡(luò)。
在上月于硅谷舉行的GPU技術(shù)大會(huì)上,F(xiàn)ridman談到了游戲如何依賴強(qiáng)化學(xué)習(xí)。在強(qiáng)化學(xué)習(xí)這種方法里,當(dāng)神經(jīng)網(wǎng)絡(luò)采取所需動(dòng)作就會(huì)得到獎(jiǎng)勵(lì),由此方法實(shí)現(xiàn)人工智能。通過(guò)反復(fù)重復(fù)這些獎(jiǎng)勵(lì),網(wǎng)絡(luò)學(xué)會(huì)了該如何做。
在這個(gè)游戲中,神經(jīng)網(wǎng)絡(luò)控制著一條沿著繁忙的高速公路行駛的紅色汽車,目標(biāo)是盡可能快地航行。初學(xué)者在瀏覽器中使用JavaScript來(lái)操縱參數(shù)并改變他們的駕駛行為。高玩通過(guò)OpenAI Gym進(jìn)入DeepTraffic,并使用Python來(lái)訓(xùn)練網(wǎng)絡(luò)。
競(jìng)速:DeepTraffic玩家使用深度學(xué)習(xí)技術(shù),在路上快速行進(jìn)
DeepTraffic最初是為Fridman在MIT教授的課程而設(shè)計(jì)。當(dāng)課程內(nèi)容和游戲甫一向公眾開(kāi)放,便受到廣泛歡迎。憑借迄今已有的超過(guò)12,000份數(shù)據(jù),DeepTraffic***競(jìng)爭(zhēng)力。用戶以他們自己的網(wǎng)絡(luò)所能達(dá)到的最快速度,在排行榜上交鋒。
游戲因競(jìng)爭(zhēng)而有趣,但真實(shí)世界的風(fēng)險(xiǎn)要高得多。自動(dòng)駕駛車輛必須規(guī)劃出從一個(gè)點(diǎn)到另一個(gè)點(diǎn)的安全路徑。AI要求被給與一個(gè)艱難的駕駛?cè)蝿?wù)。諸如DeepTraffic之類的教育工具有助于培養(yǎng)下一代AI開(kāi)發(fā)人員以及改變汽車生態(tài)系統(tǒng)的平面解決方案。
DeepTraffic在線調(diào)試地址
DeepTraffic在線調(diào)試界面