亞馬遜開(kāi)放機(jī)器學(xué)習(xí)系統(tǒng)源代碼:挑戰(zhàn)谷歌TensorFlow
北京時(shí)間5月17日上午消息, 亞馬遜 在開(kāi)源技術(shù)領(lǐng)域邁出了更大的步伐,宣布開(kāi)放該公司的機(jī)器學(xué)習(xí)軟件DSSTNE的源代碼。
這個(gè)***項(xiàng)目將與 谷歌 的TensorFlow競(jìng)爭(zhēng),后者已于去年開(kāi)源。亞馬遜表示,在缺乏大量數(shù)據(jù)對(duì)機(jī)器學(xué)習(xí)系統(tǒng)進(jìn)行訓(xùn)練的情況下,DSSTNE表現(xiàn)優(yōu)異,而TensorFlow則擅長(zhǎng)處理海量數(shù)據(jù)。
亞馬遜表示,DSSTNE的速度也快于TensorFlow。在數(shù)據(jù)量較少的情況下,其處理速度是后者的2.1倍。亞馬遜之所以開(kāi)發(fā)這款軟件,是為了在其零售平臺(tái)上向用戶推薦商品。要實(shí)現(xiàn)這一功能,這就必須借助神經(jīng)網(wǎng)絡(luò)程序的幫助,但亞馬遜進(jìn)行推薦時(shí)未必總能掌握很多數(shù)據(jù)。
亞馬遜的系統(tǒng)之所以能夠?qū)崿F(xiàn)如此快的速度,部分源于它利用了多個(gè)GPU的性能。與其他深度學(xué)習(xí)開(kāi)源軟件不同,DSSTNE可以在很多GPU之間分配任務(wù),而不會(huì)因此降低速度和準(zhǔn)度。
DSSTNE的常見(jiàn)問(wèn)題解答板塊寫道:“這意味著只需要借助1000萬(wàn)獨(dú)特商品便可提供建議,而無(wú)需借助數(shù)以億計(jì)的商品實(shí)現(xiàn)這一功能。要處理這種規(guī)模的問(wèn)題,其他軟件需要利用CPU的計(jì)算性能來(lái)分析稀疏的數(shù)據(jù),導(dǎo)致性能降低了一個(gè)數(shù)量級(jí),”
亞馬遜之所以開(kāi)放這款軟件的源代碼,是希望機(jī)器學(xué)習(xí)不僅局限于語(yǔ)音和語(yǔ)言識(shí)別領(lǐng)域,而是可以擴(kuò)大到搜索和推薦等功能中。
“我們希望世界各地的研究人員能夠共同改進(jìn)它,”DSSTNE的常見(jiàn)問(wèn)題解答板塊寫道,“但更重要的是,我們希望它能激勵(lì)更多領(lǐng)域的創(chuàng)新。”
開(kāi)發(fā)者已經(jīng)可以根據(jù)Apache 2.0開(kāi)源許可在GitHub上下載DSSTNE。