除Kaggle外,還有哪些頂級數(shù)據(jù)科學(xué)競賽平臺
在數(shù)據(jù)科學(xué)圈晃蕩的小伙伴,很少有不知道Kaggle的。Kaggle不僅是一個競賽平臺,也提供了非常好學(xué)習(xí)機會。通過比賽,你可以接觸先進(jìn)的方法和數(shù)據(jù)集、可以與志同道合的人一起參賽,最重要的是能夠向全世界展示你的才華。
除了Kaggle,其實還有不少類似的平臺,下面文摘菌就給大家盤點一下這些競爭數(shù)據(jù)科學(xué)平臺。
DrivenData
DrivenData主要舉辦的是數(shù)據(jù)科學(xué)類競賽,通過前沿的預(yù)測模型,解決世界上最棘手問題,建立一個更美好的世界。通過舉辦數(shù)據(jù)科學(xué)競賽來發(fā)揮數(shù)據(jù)在國際發(fā)展,健康,教育,醫(yī)療等社會問題中的作用。參賽者可以自己參加比賽或者發(fā)布比賽項目。
平臺地址:https://www.drivendata.org/
該平臺有一個專門的案例分析部分,以案例研究的形式提供一些成功項目的信息。DrivenData中列出的數(shù)據(jù)集與非營利組織相關(guān),范圍從野生動物保護(hù)到公共健康。因此,如果你想將數(shù)據(jù)技能應(yīng)用于實際問題,DrivenData是一個很好的選擇。
CrowdANALYTIX
CrowdANALYTIX是一個眾包分析平臺,他們將商業(yè)挑戰(zhàn)和業(yè)務(wù)問題轉(zhuǎn)化為競賽。參賽者可以在CrowdANALYTIX社區(qū)內(nèi)通過合作或競爭來構(gòu)建和優(yōu)化AI,ML,NLP和深度學(xué)習(xí)算法的項目。該平臺還擁有一個社區(qū)博客,其中包含大量資源,包括訪談和參考資料。
- 平臺地址https://www.crowdanalytix.com/community
- 社區(qū)博客:https://www.crowdanalytix.com/jq/communityBlog/listBlog.html
InnoCentive
InnoCentive 是一家開放式創(chuàng)新型的研究公司。最早是由醫(yī)藥制造商禮來公司資助,創(chuàng)立于2001年,最初的職能是化學(xué)和生物領(lǐng)域的研發(fā)供求網(wǎng)絡(luò)平臺。服務(wù)于190多個國家,為390000人提供相關(guān)服務(wù)。
該平臺主要專注于處理生命科學(xué)的問題,但研究領(lǐng)域也包括數(shù)學(xué)、物理、化學(xué)、工程、計算機科學(xué)等。參與者需要具有批判性的思維、研究力、創(chuàng)造力、和多學(xué)科知識的交叉來解決平臺上的實際問題。提出解決方案不僅是一次非常好的能力鍛煉,同時也可以獲得相應(yīng)的報酬。
平臺鏈接:https://www.innocentive.com/our-solvers/
TundIT
TunedIT最初是華沙大學(xué)的一個科學(xué)博士項目。目標(biāo)是幫助數(shù)據(jù)科學(xué)家進(jìn)行可重復(fù)的實驗的,并輕松評估數(shù)據(jù)驅(qū)動的算法。隨后,創(chuàng)始團(tuán)隊為了教育研究、科學(xué)實驗和一些商業(yè)目的開發(fā)了TunedIT Challenges平臺,用于舉辦此類的數(shù)據(jù)競賽。
平臺鏈接:
https://towardsdatascience.com/top-competitive-data-science-platforms-other-than-kaggle-2995e9dad93c
Codalab
Codalab是一個開源的基于Web的平臺,它使研究人員,開發(fā)人員和數(shù)據(jù)科學(xué)家能夠在同一平臺上進(jìn)行協(xié)作,目標(biāo)是推進(jìn)使用機器學(xué)習(xí)和高級計算領(lǐng)域的研究。CodaLab通過其在線社區(qū)幫助解決了許多數(shù)據(jù)導(dǎo)向研究領(lǐng)域的常見問題。平臺既支持參加現(xiàn)有的比賽,也支持舉辦新的比賽。
平臺鏈接:https://competitions.codalab.org/
Analytics Vidhya
Analytics Vidhya 是一個為分析師和數(shù)據(jù)科學(xué)專家區(qū)提供的知識社區(qū)。除了為數(shù)據(jù)科學(xué)分析提供大量資源外,平臺的Hackathons旨在解決一些工商業(yè)界存在的實際問題,并通過競賽的形式發(fā)布。在這個平臺上,你既可以參與挑戰(zhàn),也可以贊助比賽。很多在Analytics Vidhya組織Hackathons挑戰(zhàn)的大公司也會為優(yōu)秀的參賽者提供工作機會。
平臺鏈接:https://datahack.analyticsvidhya.com/?utm_source=main-logo
CrowdAI
數(shù)據(jù)科學(xué)挑戰(zhàn)平臺crowdAI每年都會面臨多項開放數(shù)據(jù)科學(xué)挑戰(zhàn)。挑戰(zhàn)包括圖像分類,文本識別,強化學(xué)習(xí),對抗性攻擊,圖像分割,資源分配優(yōu)化以及跨領(lǐng)域問題。這個平臺曾在亞馬遜和Nvidia獲得了超過10萬美元,然后發(fā)布稱為“Learning to Run”的競賽。
- crowdAI:https://www.crowdai.org/challenges
- Learning to Run:https://www.crowdai.org/challenges/nips-2017-learning-to-run
Numerai
Numerai是由AI運行,是一群對沖基金圈的數(shù)據(jù)科學(xué)家建設(shè)。每周舉辦一次數(shù)據(jù)科學(xué)競賽,為真正的對沖基金提供支持。Numerai每周向其參與者提供加密數(shù)據(jù),然后參與者提交預(yù)測模型。然后,Numerai從其所有提交中創(chuàng)建一個元模型并進(jìn)行投資。如果投資有收益,數(shù)據(jù)科學(xué)家提交的預(yù)測可以換取加密Blockchain令牌。
平臺鏈接:https://numer.ai/rounds
天池
天池是阿里云的數(shù)據(jù)競爭平臺,在很多方面類似于Kaggle。這是一個由數(shù)十萬數(shù)據(jù)科學(xué)家相互合作并與全球企業(yè)和政府聯(lián)系以解決各行業(yè)最棘手的業(yè)務(wù)問題的社區(qū)。
平臺鏈接:https://tianchi.aliyun.com/competition/gameList/activeList
大數(shù)據(jù)專家、阿里巴巴集團(tuán)副總裁涂子沛介紹,比賽中勝出的優(yōu)秀數(shù)據(jù)模型,不僅可用于參賽者的學(xué)術(shù)研究成果,還有機會走出實驗室,直接應(yīng)用于淘寶、 支付寶等真實的商業(yè)場景,影響中國乃至世界數(shù)以億計的用戶。
Data Science Challenge
平臺上的數(shù)據(jù)科學(xué)挑戰(zhàn)是由英國政府部門贊助,包括國防科學(xué)技術(shù)實驗室(Dstl)、政府科學(xué)辦公室,SIS和MI5在內(nèi)多個政府部門。這些挑戰(zhàn)旨在鼓勵數(shù)據(jù)科學(xué)領(lǐng)域最聰明的人才幫助解決現(xiàn)實問題。目前,該平臺提供的兩個挑戰(zhàn)已經(jīng)結(jié)束,但仍會有源源不斷的問題等待者挑戰(zhàn)者去解決。
平臺鏈接:https://www.datasciencechallenge.org/
KDD Cup
KDD Cup是由ACM特別興趣小組組織的年度Data Mining 和Knowledge Discovery競賽。2019界SIGKDD將于2019年8月4日至8日在美國阿拉斯加州安克雷奇舉行。 KDD杯比賽預(yù)計將持續(xù)2-4個月,獲勝者將在2019年7月中旬通知。
今年的三個競賽課題為:
- 常規(guī)機器學(xué)習(xí)競賽軌道(常規(guī)ML軌道)
- 自動機器學(xué)習(xí)競賽軌道(Auto-ML Track)
- “人文研究”強化學(xué)習(xí)競賽軌道(Humanity RL Track)
平臺鏈接:https://www.kdd.org/kdd2019/kdd-cup
相關(guān)報道:
https://towardsdatascience.com/top-competitive-data-science-platforms-other-than-kaggle-2995e9dad93c
【本文是51CTO專欄機構(gòu)大數(shù)據(jù)文摘的原創(chuàng)譯文,微信公眾號“大數(shù)據(jù)文摘( id: BigDataDigest)”】