3 Alternatif Kaggle untuk sains data kolaboratif

Apakah kaedah terbaik untuk mendapatkan jawapan yang baik untuk soalan sukar? Tanya sekumpulan orang, dan buat pertandingan daripadanya. Sudah lama pendekatan Kaggle untuk sains data: Ubah misi yang sukar, seperti membuat pengesanan barah paru-paru lebih tepat, menjadi pertandingan membayar karunia, di mana pasukan terbaik dan algoritma terbaik menang.

Sekarang Kaggle meluncur ke Google, dan sementara semua tanda menunjukkan ia disimpan seperti sekarang, akan ada kegelisahan mengenai prospek jangka panjang untuk laman web dengan komuniti yang setia dan pendekatan yang unik.

Berikut adalah tiga laman web lain yang berkongsi misi serupa, jika tidak diikuti secara eksplisit mengikut jejak Kaggle. (Perhatikan bahawa beberapa laman web, seperti CrowdAnalytix, mungkin menganggap penyelesaian yang diterima dalam peraduan sebagai karya untuk disewa dan dengan demikian harta mereka.)

CrowdAI

Produk dari Polytechnique École Fédérale de Lausanne di Switzerland, CrowdAI adalah platform sumber terbuka untuk menganjurkan cabaran data terbuka dan mendapatkan gambaran mengenai bagaimana masalah-masalah tersebut diselesaikan. Platform ini cukup baru, dengan hanya enam cabaran yang ditawarkan setakat ini, tetapi tutorial yang berasal dari cabaran tersebut terperinci dan berharga, menyediakan metodologi langkah demi langkah untuk menghasilkan semula karya itu atau membuat sesuatu yang serupa. Latihan yang ada merangkumi kerangka kerja biasa seperti Torch atau TensorFlow, jadi ini adalah tempat yang baik untuk memperoleh butiran langsung untuk menggunakannya.

DidorongData

DrivenData, yang dibuat oleh perunding yang menangani masalah data profesional, menjadi tuan rumah kepada cabaran dalam talian yang berlangsung selama beberapa bulan. Masing-masing tertumpu pada masalah mendesak yang dihadapi dunia secara umum, seperti meramalkan penyebaran penyakit atau melombong data Yelp untuk meningkatkan proses pemeriksaan restoran. Seperti Kaggle, DrivenData juga mempunyai papan penyenaraian pekerjaan sains data - ciri yang dikhuatiri orang mungkin hilang dari pemerolehan Kaggle selepas pemerolehan.

CrowdAnalytix

Disokong oleh pelabur dari Accel Partners dan SAIF Partners, CrowdAnalytix memberi tumpuan kepada penganjuran pertandingan penyelesaian masalah berdasarkan data, dan bukannya berkongsi maklumat yang dihasilkan daripada mereka. Peraduan ditawarkan untuk mencari penyelesaian masalah dalam kategori seperti pemodelan, visualisasi, dan penyelidikan, dan masing-masing mempunyai hadiah dalam ribuan dolar. Beberapa cabaran sebelumnya termasuk meramalkan kos sebenar tuntutan pampasan pekerja atau kelewatan syarikat penerbangan. Peraduan lain, bagaimanapun, tidak dihoskan untuk mendapatkan wang, tetapi untuk memberikan pilihan yang kompetitif untuk mempelajari disiplin yang berkaitan, seperti bahasa R.