五月GitHub最熱機(jī)器學(xué)習(xí)項(xiàng)目都在這里了
本文經(jīng)AI新媒體量子位(公眾號(hào)ID:QbitAI)授權(quán)轉(zhuǎn)載,轉(zhuǎn)載請(qǐng)聯(lián)系出處。
您的五月余額已不足,這個(gè)月最新最火的機(jī)器學(xué)習(xí)項(xiàng)目都看過了嗎?
Mybridge AI博客從將近250個(gè)機(jī)器學(xué)習(xí)開源項(xiàng)目中找到了標(biāo)星數(shù)排名最靠前的Top 10項(xiàng)目,涵蓋視覺問答、對(duì)象檢測、自動(dòng)生成評(píng)論等多個(gè)維度。
一起來看看吧~
第1名:Pythia
Pythia是Facebook人工智能實(shí)驗(yàn)室出品的視覺和語言多模式研究的模塊化框架,2138星。
Pythia基于PyTorch,支持Model Zoo、多任務(wù),有各種內(nèi)置數(shù)據(jù)集比如VQA、VizWiz,支持基于DataParallel和DistributedDataParallel的分布式訓(xùn)練,還可以實(shí)現(xiàn)高度自定義。

另外,拿Pythia來做TextVQA和VQA的入門代碼庫也不錯(cuò)。
鏈接:
https://github.com/facebookresearch/pythia
第2名:云注釋(Cloud Annotations)
自定義對(duì)象檢測和分類訓(xùn)練,2014星。
基于IBM云對(duì)象存儲(chǔ),在TensorFlow上訓(xùn)練,需要先在線進(jìn)行圖像標(biāo)注,macOS,Windows和Linux都可以用。
鏈接:
https://github.com/cloud-annotations/training
第3名:PySOT
商湯出品,可以在視頻里追蹤單個(gè)對(duì)象,實(shí)現(xiàn)SiamRPN和SiamMask等算法,1703星。



PySOT實(shí)現(xiàn)了最先進(jìn)的單一對(duì)象跟蹤算法,包括SiamRPN和SiamMask等,用Python編寫,在PyTorch上運(yùn)行。
鏈接:
https://github.com/STVIR/pysot
第4名:PyTorch-BigGraph
大規(guī)模圖形結(jié)構(gòu)數(shù)據(jù)生成嵌入軟件,1417星,同樣也是Facebook出品,主要作者是巴黎的Luca Wehrstedt。
PyTorch-BigGraph是一個(gè)分布式系統(tǒng),可以搞定多達(dá)數(shù)十億實(shí)體和數(shù)萬億邊緣的大型網(wǎng)絡(luò)交互圖形。
用PyTorch-BigGraph的話需要Python 3.6或更高版本,最低PyTorch 1.0,不需要投喂GPU,但是比較費(fèi)CPU。
鏈接:
https://github.com/facebookresearch/PyTorch-BigGraph
第5名:InterpretML - Alpha
微軟出品,用來訓(xùn)練可解釋的機(jī)器學(xué)習(xí)模型,1039星。
這里的“可解釋”指的是可以解釋模型調(diào)試中遇到的錯(cuò)誤,模型有沒有搞歧視,如何讓人類理解這個(gè)模型,模型是否合法,在醫(yī)療、司法等高風(fēng)險(xiǎn)的領(lǐng)域靠不靠譜。
鏈接:
https://github.com/microsoft/interpret
第6名:Weights & Biases
可視化和追蹤機(jī)器學(xué)習(xí)實(shí)驗(yàn)工具,1098星。
分析機(jī)器學(xué)習(xí)實(shí)驗(yàn),比TensorBoard更輕量級(jí)。每次運(yùn)行時(shí),可以保存超參數(shù)和輸出指標(biāo),訓(xùn)練過程中能實(shí)現(xiàn)可視化模型,還能自動(dòng)跟蹤代碼狀態(tài),系統(tǒng)指標(biāo)和配置參數(shù)。
鏈接:
https://github.com/wandb/client
第7名:MLIR
“多級(jí)中間表示”編譯器基礎(chǔ)結(jié)構(gòu),832星。
TensorFlow的一部分。MLIR旨在成為一種混合IR(intermediate representation),可以支持統(tǒng)一基礎(chǔ)架構(gòu)中的多種不同要求,能夠表示所有TensorFlow圖,在TensorFlow圖上實(shí)現(xiàn)優(yōu)化和轉(zhuǎn)換,用TensorFlow圖或者TF Lite完成量化和圖變換。
鏈接:
https://github.com/tensorflow/mlir
第8名:MeshCNN
PyTorch中三維網(wǎng)格的卷積神經(jīng)網(wǎng)絡(luò),367星。
這是SIGGRAPH 2019上發(fā)表的一篇論文,可以用來做3D形狀分割,作者來自以色列特拉維夫大學(xué)和亞馬遜。

類似傳統(tǒng)CNN,MeshCNN結(jié)合了在網(wǎng)格邊緣上運(yùn)行的專用卷積和池化層。卷積應(yīng)用于邊緣和它們的入射三角形的四個(gè)邊緣,池化層用邊緣折疊操作保留表面拓?fù)浣Y(jié)構(gòu),給后面的層生成了網(wǎng)狀連接。
鏈接:
https://github.com/ranahanocka/MeshCNN
第9名:TensorWatch
微軟出品,用于深度學(xué)習(xí)和強(qiáng)化學(xué)習(xí)的調(diào)試,監(jiān)控和可視化,299星。

TensorWatch是一款專為深度學(xué)習(xí)和強(qiáng)化學(xué)習(xí)而設(shè)計(jì)的debug和可視化工具。它充分利用Jupyter Notebook顯示實(shí)時(shí)可視化,不需要一直翻日志就能實(shí)時(shí)查詢訓(xùn)練過程,還可以用來構(gòu)建自己的UI和儀表板。
此外,TensorWatch利用幾個(gè)優(yōu)秀的庫來可視化模型圖,審查模型統(tǒng)計(jì),解釋預(yù)測等。
鏈接:
https://github.com/microsoft/tensorwatch
第10名:hncynic
一個(gè)獵奇項(xiàng)目,自動(dòng)生成hacker news風(fēng)格的評(píng)論,完全無視文章本身,看一眼標(biāo)題,剩下全靠編,240星。
來源靠的是hacker news評(píng)論數(shù)據(jù),借此訓(xùn)練Transformer編碼器-解碼器模型,中途還順手用了一下維基百科的數(shù)據(jù)。
生成的評(píng)論大多腦洞清奇。
比如這個(gè)新聞標(biāo)題《用TensorFlow檢測魚》,生成的評(píng)論是醬嬸的:
這篇文章太辣雞了。
1.為什么代碼看起來像一堆黑盒子標(biāo)簽?我沒有看到它。
2.為什么你的模型不利用這些理論?為什么不是黑盒子分類器?
如果模型沒有取出紅盒子,它開始看到紅盒子,看起來像一個(gè)沒有明確顏色的黑盒子(看起來它知道藍(lán)色是什么)——它怎么能看到紅盒子,甚至能看出是黑盒子?
在一個(gè)不了解我們?nèi)绾问褂?ldquo;黑匣子”和“藍(lán)盒子”來檢測真實(shí)環(huán)境中的魚類并使用黑匣子代替白紙盒的世界中,我們都知道這一點(diǎn)。
看起來好像很有道理的樣子,然而完全不知道在說啥,而且是滿滿的杠精畫風(fēng)啊!
鏈接:
https://github.com/leod/hncynic
傳送門
原文鏈接:
https://medium.mybridge.co/machine-learning-open-source-for-the-past-month-v-may-2019-bf4ff9b80b1b