3 alternative Kaggle per la scienza dei dati collaborativa

Qual è il modo migliore per ottenere una buona risposta a una domanda difficile? Chiedete a un gruppo di persone e fatene una competizione. Questo è stato a lungo l'approccio di Kaggle alla scienza dei dati: trasformare missioni difficili, come rendere più accurato il rilevamento del cancro ai polmoni, in competizioni a pagamento, dove vincono le migliori squadre e i migliori algoritmi.

Ora Kaggle sta entrando in Google, e mentre tutti i segnali indicano che per ora è mantenuto così com'è, ci saranno nervosismo sulle prospettive a lungo termine per un sito con una comunità così devota e un approccio idiosincratico.

Ecco altri tre siti che condividono una missione simile, se non esplicitamente seguita sulle orme di Kaggle. (Si noti che alcuni siti, come CrowdAnalytix, possono considerare le soluzioni accettate nei concorsi come lavori su commissione e quindi di loro proprietà.)

CrowdAI

Un prodotto dell'École Polytechnique Fédérale de Lausanne in Svizzera, CrowdAI è una piattaforma open source per ospitare sfide di dati aperti e ottenere informazioni su come i problemi in questione sono stati risolti. La piattaforma è abbastanza nuova, con solo sei sfide offerte finora, ma i tutorial derivati ​​da quelle sfide sono dettagliati e preziosi, fornendo metodologie passo dopo passo per riprodurre quel lavoro o creare qualcosa di simile. Gli esercizi esistenti coprono framework comuni come Torch o TensorFlow, quindi è un buon posto per acquisire dettagli pratici per utilizzarli.

DrivenData

DrivenData, creato da una società di consulenza che si occupa di problematiche professionali dei dati, ospita sfide online della durata di alcuni mesi. Ognuno si concentra specificamente sui problemi urgenti che il mondo deve affrontare in generale, come la previsione della diffusione di malattie o l'estrazione dei dati di Yelp per migliorare i processi di ispezione dei ristoranti. Come Kaggle, DrivenData ha anche una bacheca dei lavori di data science: una funzione che le persone temono possa scomparire dalla post-acquisizione di Kaggle.

CrowdAnalytix

Supportato da investitori di Accel Partners e SAIF Partners, CrowdAnalytix si concentra sull'hosting di competizioni per la risoluzione dei problemi basate sui dati, piuttosto che sulla condivisione delle informazioni che ne derivano. Vengono offerti concorsi per trovare soluzioni a problemi in categorie come modellazione, visualizzazione e ricerca, e ognuno ha premi di migliaia di dollari. Alcune delle sfide precedenti includono la previsione dei costi reali delle richieste di risarcimento dei lavoratori o dei ritardi delle compagnie aeree. Altri concorsi, tuttavia, non sono ospitati per denaro, ma per fornire un'opzione competitiva per imparare una disciplina correlata, come la lingua R.