Menghindari Kesalahan Data

Ilustrasi Visualisasi Data | Pribadi

Dalam dunia data analisis ada berbagai metode mengolah dan menyajikan data. Di era big data saat ini, ada begitu banyak kesalahan pengambilan keputusan sebagai imbas dari kesalahan pengolahan dan penyajian data. Untuk menghindarinya kamu perlu memperhatikan beberapa hal berikut ini:

Cherry Picking
Memilih hasil yang sesuai dengan klaimmu dan mengecualikan yang tidak.

Data Dredging
Menguji hipotesis baru berulang kali terhadap set data yang sama, gagal mengakui bahwa sebagian besar korelasi akan menjadi hasil dari kebetulan.

Survivor Bias
Menarik kesimpulan dari kumpulan data yang tidak lengkap, karena data tersebut telah "selamat" dari kriteria seleksi yang sama.

Cobra Effect
Menetapkan insentif yang secara tidak sengaja menghasilkan hasil yang berlawanan dengan yang diinginkan. Juga dikenal sebagai Insentif Jahat.

False Causality
Salah berasumsi ketika dua peristiwa muncul terkait bahwa satu harus menyebabkan yang lain.

Garrymandering
Memanipulasi batas geografis yang digunakan untuk mengelompokkan data untuk mengubah hasilnya.

Sampling Bias
Menarik kesimpulan dari serangkaian data yang tidak mewakili populasi yang kamu coba pahami.

Gambler's Fallacy
Secara keliru meyakini bahwa karena sesuatu telah terjadi lebih sering daripada biasanya, sekarang kecil kemungkinannya terjadi di masa depan (dan sebaliknya).

Hawthorne Effect
Tindakan memantau seseorang dapat memengaruhi perilaku mereka, yang mengarah pada temuan palsu. Juga dikenal sebagai Efek Pengamat.

Regression Fallacy
Ketika sesuatu terjadi yang luar biasa baik atau buruk, itu akan kembali ke rata-rata seiring waktu.

Simpson's Paradox
Ketika tren muncul di subset data yang berbeda tetapi menghilang atau terbalik ketika kelompok digabungkan.

Mcnamara Fallacy
Bergantung hanya pada metrik dalam situasi yang kompleks dan kehilangan gambaran yang lebih besar.

Overfitting
Membuat model yang terlalu disesuaikan dengan data yang kamu miliki dan tidak mewakili tren umum.

Publication Bias
Temuan penelitian yang menarik lebih mungkin dipublikasikan, mengubah kesan kita tentang kenyataan.

Danger of Summary Metrics
Hanya melihat metrik ringkasan dan gagal melihat perbedaan besar dalam data mentah.

Comments