3月份Github上最熱門的數據科學和機器學習項目
Analytics Vidhya 近日發布了GitHub上3月份最熱門的5個數據科學和機器學習項目,本月的名單從Google Brain的AstroNet到人造神經網絡可視化工具,這都是非常棒的項目,相信一定可以擴展你的機器學習視野。
1、Person Blocker
Person Blocker 是一個python庫,可以使用預先訓練好的神經網絡自動屏蔽圖像中的所有人。該算法底層實現是在 MS COCO 數據集上預訓練的 Mask R-CNN,但它不需要 GPU!此外,它不僅可屏蔽人像,還可以屏蔽包括長頸鹿和汽車在內的多達 80 種不同類型的物體,包括車輛,動物,電子小配件等。(項目地址:https://github.com/minimaxir/person-blocker)
2、AstroNet
早在2017年12月,Google Brain團隊就透露Astronet應用發現了2顆新行星 - 它是處理天文數據的深層神經網絡模型。這是一個巨大的發現,它展現了機器學習在當今世界產生的深遠影響。
現在,Google Brain已經發布了該技術的全部代碼,并且已經將它提供給所有人。該模型基于卷積神經網絡(CNN)。(項目地址:https://feedburner.google.com/fb/a/mailverify?uri=Avbytes)
3、ANN Visualizer
ANN Visualizer是一個python庫,它使我們能夠使用一行代碼就可視化人工神經網絡。它用于與Keras一起工作,并利用python的graphviz庫創建一個整潔和可視化的圖形,用來表示你正在構建的神經網絡。(項目地址:https://github.com/Prodicode/ann-visualizer)
4、Fast Pandas
熊貓是為數據科學家和開發人員提供的最靈活和***大的工具之一。非常靈活,人們可以通過幾種方式執行特定的任務。該項目旨在針對這些情況下的不同可用方法進行基準測試; 此外,在numpy和pandas中都有專門的功能部分。(項目地址:https://github.com/mm-mansour/Fast-Pandas)
5、TensorFlow.js
TensorFlow.js 是一個開源硬件加速 JavaScript 庫,用于訓練和部署機器學習模型。TensorFlow.js 的 API 靈活且直觀,可以使用低級的 JavaScript 線性代數庫和高級圖層 API 在瀏覽器中定義、訓練和運行完整的機器學習模型。(項目地址:https://github.com/jimfleming/tensorflowjs)
6、Caffe64
Caffe64是一個簡單,小巧但功能非常強大的神經網絡庫。Caffe64被認為是最容易編譯的庫和最輕量級的神經網絡庫。(項目地址:https://github.com/dfouhey/caffe64)
7、TensorFlow Hub
TensorFlow Hub是一個用于促進機器學習模型的可重用部分發布、發現和使用的庫。它提供了模塊,這些模塊是預先訓練好的TensorFlow模型,可用于新任務。通過在相關任務上重用模塊,你可以:
- 用較小的數據集訓練模型
- 改進泛化
- 大大加快了培訓(項目地址:https://github.com/tensorflow/hub)