機器學習免費跑分神器：集成各大數據集，連接GitHub就能用

作者：栗子魚羊 2019-10-12 11:20:42

新聞機器學習

搞機器學習的小伙伴們，免不了要在各種數據集上，給AI模型跑分。現在，Papers with Code (那個以論文搜代碼的神器) 團隊，推出了自動跑分服務，名叫sotabench，以跑遍所有開源模型為己任。

本文經AI新媒體量子位（公眾號ID:QbitAI）授權轉載，轉載請聯系出處。

搞機器學習的小伙伴們，免不了要在各種數據集上，給AI模型跑分。

現在，Papers with Code (那個以論文搜代碼的神器) 團隊，推出了自動跑分服務，名叫sotabench，以跑遍所有開源模型為己任。

有了它，不用上傳代碼，只要連接GitHub項目，就有云端GPU幫你跑分；每次提交了新的commit，系統又會自動更新跑分。還有世界排行榜，可以觀察各路強手的成績。

除了支持各大主流數據集，還支持用戶上傳自己的數據集。

也可以看看，別人的論文結果，到底靠譜不靠譜。

比如說，fork一下Facebook的FixRes這個項目，配置一下評估文件：

然后一鍵關聯，讓Sotabench的GPU跑一下ImageNet的圖像分類測試。

就能得到這樣的結果：

Top-1準確率，Top-5準確率，跟論文的結果有何差距（見注），運行速度，全球排名，全部一目了然。

注：ε-REPR，結果與論文結果差距在0.3%以內時打勾，差距≥0.3%且比論文結果差顯示為紅叉，比論文結果好顯示為勾+

這個免費的跑分神器，發布一天，便受到熱烈歡迎：推特點贊600+，Reddit熱度270+。

網友紛紛表示：這對開發者社區來說太有用了！

那么，先來看一下sotabench的功能和用法吧。

用法簡單，海納百川

團隊說，sotabench就是Papers with Code的雙胞胎姐妹：

Papers with Code大家很熟悉了，它觀察的是論文報告的跑分。可以用來尋找高分模型對應的代碼，是個造福人類的工具。

與之互補，sotabench觀察的是開源項目，代碼實際運行的結果。可以測試自己的模型，也能驗證別家的模型，是不是真有論文說的那么強。

它支持跟其他模型的對比，支持查看速度和準確率的取舍情況。

那么，sotabench怎么用？簡單，只要兩步。

第一步，先在本地評估一下模型：

在GitHub項目的根目錄里，創建一個sotabench.py文件。里面可以包含：加載、處理數據集和從中得出預測所需的邏輯。每提交一個commit，這個文件都會運行。然后，用個開源的基準測試庫來跑你的模型。這個庫可以是sotabench-eval，這個庫不問框架，里面有ImageNet等等數據集；也可以是torchbench，這是個PyTorch庫，和PyTorch數據集加載器搭配食用更簡單。