Kaggle



Kaggle adalah situs dan platform untuk berlomba membuat model terbaik untuk menganalisa dan memprediksi suatu dataset. Dataset ini diberikan oleh suatu perusahaan, dengan suatu deskripsi masalah tertentu. Misalnya, diberikan data rumah beserta fitur-fiturnya dan harga jualnya, dan deskripsi masalahnya adalah buatlah model untuk memprediksi harga jual berdasarkan fitur-fitur tersebut. Sederhana kan? Kalau Anda bisa membuat model terbaik, ada hadiah total USD $1.2 juta dolar hehe.

Kaggle sangat bermanfaat untuk semua yang berkecimpung di dunia data science.
Banyak perusahaan yang mempunyai permasalahan analisa/pemodelan data, namun mereka tidak punya sumber daya data scientist yang mumpuni untuk memecahkannya. Dengan Kaggle, mereka bisa meminta bantuan data scientist seluruh dunia untuk memecahkan masalah tersebut dengan membuat model terbaik. Istilah kerennya crowd sourcing. Biasanya dengan dengan imbalan hadiah.

Kaggle juga dapat dimanfaatkan oleh perusahaan untuk merekrut data scientist atau ML engineer, dengan cara menyelenggarakan kompetisi untuk tujuan rekrutmen.

Bagi kita praktisi atau pelajar data science, Kaggle sangat berguna untuk belajar, berlatih,  dan mempertajam skill dan insting data science kita. Dengan mempelajari write up atau ulasan orang lain dalam memecahkan suatu masalah, kita bisa mendapat banyak ide dan ilmu tentang bagaimana proses dan jalan berpikir dia memecahkan masalah data science. Lalu dengan ikut dalam kompetisi, kita akan diberi feedback tentang akurasi model kita, dan dari situ kita berlatih bagaimana membuat model yang lebih baik. Selama kompetisi, sering orang berbagi tips atau ide yang dia pakai, sehingga dari situ tidak hanya kita bisa memperbaiki model kita, tapi kita juga bisa belajar, menjadi lebih kreatif, sekaligus melatih instingpemecahan masalah kita.

Setelah kompetisi selesai, biasanya para pemenang atau orang yang mendapat skor tinggi akan menulis write up tentang solusi dia juga, sehingga kita bisa belajar solusi yang wow itu seperti apa.

Bahkan walaupun Anda masih pemula sekali, yang belum bisa koding membuat model sendiri (seperti saya saat menulis artikel ini), membaca ulasan Kaggle sangat berguna untuk mengetahui bagaimana contoh permasalahan data science di dunia nyata (misalnya, dataset di dunia nyata sering terdapat banyak cacat, tidak seperti dataset di kelas MOOC), bagaimana cara berpikir seorang data scientist dalam memecahkan suatu masalah, dan pengetahuan-pengetahuan apa yang harus dipelajari untuk membuat solusinya.
Jadi saya sangat menyarankan untuk bergabung dengan Kaggle.


Komentar

Postingan populer dari blog ini

Gitkraken

DATA SPASIAL

Measurement, Euclidean, Cost-Weighted Distance, Path-Distance Analysis