Kaggle
Kaggle adalah situs dan platform untuk berlomba membuat model
terbaik untuk menganalisa dan memprediksi suatu dataset. Dataset
ini diberikan oleh suatu perusahaan, dengan suatu deskripsi masalah tertentu.
Misalnya, diberikan data rumah beserta fitur-fiturnya dan harga jualnya, dan
deskripsi masalahnya adalah buatlah model untuk memprediksi harga jual
berdasarkan fitur-fitur tersebut. Sederhana kan? Kalau Anda bisa membuat model
terbaik, ada hadiah total USD $1.2 juta dolar hehe.
Banyak perusahaan yang mempunyai permasalahan analisa/pemodelan data, namun
mereka tidak punya sumber daya data
scientist yang mumpuni untuk memecahkannya. Dengan Kaggle, mereka bisa meminta
bantuan data scientist seluruh dunia
untuk memecahkan masalah tersebut dengan membuat model terbaik. Istilah
kerennya crowd sourcing. Biasanya dengan
dengan imbalan hadiah.
Kaggle juga dapat dimanfaatkan oleh perusahaan untuk merekrut data scientist atau ML
engineer, dengan cara menyelenggarakan kompetisi untuk tujuan rekrutmen.
Bagi kita praktisi atau pelajar data
science, Kaggle sangat berguna untuk belajar, berlatih, dan
mempertajam skill dan insting data science kita. Dengan mempelajari write up atau ulasan orang lain dalam memecahkan
suatu masalah, kita bisa mendapat banyak ide dan ilmu tentang bagaimana proses
dan jalan berpikir dia memecahkan masalah data science. Lalu dengan ikut dalam kompetisi, kita
akan diberi feedback tentang akurasi model kita, dan
dari situ kita berlatih bagaimana membuat model yang lebih baik. Selama
kompetisi, sering orang berbagi tips atau ide yang dia pakai, sehingga dari
situ tidak hanya kita bisa memperbaiki model kita, tapi kita juga bisa belajar,
menjadi lebih kreatif, sekaligus melatih instingpemecahan masalah
kita.
Setelah kompetisi selesai, biasanya para pemenang atau orang yang mendapat
skor tinggi akan menulis write
up tentang solusi dia juga, sehingga kita bisa belajar solusi yang wow
itu seperti apa.
Bahkan walaupun Anda masih pemula sekali, yang belum bisa koding membuat
model sendiri (seperti saya saat menulis artikel ini), membaca ulasan Kaggle
sangat berguna untuk mengetahui bagaimana contoh permasalahan data science di dunia nyata (misalnya, dataset
di dunia nyata sering terdapat banyak cacat, tidak seperti dataset di kelas
MOOC), bagaimana cara berpikir seorang data
scientist dalam memecahkan suatu masalah, dan pengetahuan-pengetahuan apa yang
harus dipelajari untuk membuat solusinya.
Jadi saya sangat menyarankan untuk bergabung dengan Kaggle.
Komentar
Posting Komentar