Teknologi

5 bias kognitif dalam ilmu data – dan bagaimana menghindarinya

5 bias kognitif dalam ilmu data - dan bagaimana menghindarinya

5 bias kognitif dalam ilmu data – dan bagaimana menghindarinya

 

5 bias kognitif dalam ilmu data - dan bagaimana menghindarinya
5 bias kognitif dalam ilmu data – dan bagaimana menghindarinya

Baru-baru ini, saya membaca The Art of Thinking Clear karya Rolf Dobell , yang membuat saya berpikir tentang bias kognitif dengan cara yang tidak pernah saya miliki sebelumnya. Saya menyadari betapa mendalamnya beberapa bias kognitif. Bahkan, kita sering bahkan tidak secara sadar menyadari ketika pemikiran kita dipengaruhi oleh pikiran kita. Bagi para ilmuwan data, bias ini benar-benar dapat mengubah cara kita bekerja dengan data dan membuat keputusan kita sehari-hari, dan umumnya tidak menjadi lebih baik.

Ilmu data adalah, meskipun tampak obyektifitas dari semua fakta yang kami kerjakan, secara mengejutkan subjektif dalam prosesnya. Sebagai ilmuwan data, tugas kita adalah memahami fakta. Dalam melakukan analisis ini, kita harus membuat keputusan subjektif. Jadi meskipun kami bekerja dengan fakta dan data yang sulit, ada komponen interpretif yang kuat untuk ilmu data.

Acara online TNW
Konferensi Couch kami mempertemukan para pakar industri untuk membahas apa yang akan terjadi selanjutnya

DAFTAR SEKARANG
Akibatnya, para ilmuwan data harus sangat berhati-hati, karena semua manusia sangat rentan terhadap bias kognitif. Kami tidak terkecuali. Bahkan, saya telah melihat banyak contoh di mana para ilmuwan data akhirnya membuat keputusan berdasarkan keyakinan yang sudah ada sebelumnya, data yang terbatas atau hanya preferensi yang tidak rasional.

Pada bagian ini, saya ingin menunjukkan lima jenis bias kognitif yang paling umum. Saya juga akan menawarkan beberapa saran tentang bagaimana para ilmuwan data dapat bekerja untuk menghindarinya dan membuat keputusan yang lebih baik dan lebih beralasan.

Bias bertahan hidup
Selama Perang Dunia II, para peneliti dari kelompok riset nirlaba Centre for Naval Analysis ditugaskan dengan masalah. Mereka perlu memperkuat pesawat tempur militer di tempat terlemah mereka. Untuk mencapai ini, mereka beralih ke data. Mereka memeriksa setiap pesawat yang kembali dari misi tempur dan mencatat di mana peluru menabrak pesawat. Berdasarkan informasi itu, mereka merekomendasikan agar pesawat diperkuat di tempat-tempat yang tepat.

Apakah Anda melihat ada masalah dengan pendekatan ini?

Masalahnya, tentu saja, adalah mereka hanya melihat pesawat yang kembali dan bukan pesawat yang tidak. Tentu saja, data dari pesawat yang telah ditembak jatuh hampir pasti akan jauh lebih berguna dalam menentukan di mana kerusakan fatal pada pesawat kemungkinan telah terjadi, karena mereka yang menderita kerusakan akibat bencana.

Tim peneliti menderita bias penyintas: mereka hanya melihat data yang tersedia bagi mereka tanpa menganalisis situasi yang lebih besar. Ini adalah bentuk bias seleksi di mana kami secara implisit menyaring data berdasarkan beberapa kriteria arbitrer dan kemudian mencoba masuk akal tanpa menyadari atau mengakui bahwa kami sedang bekerja dengan data yang tidak lengkap.

Mari kita pikirkan bagaimana ini mungkin berlaku untuk pekerjaan kita dalam ilmu data. Katakanlah Anda mulai mengerjakan kumpulan data. Anda telah membuat fitur Anda dan mencapai akurasi yang layak pada tugas pemodelan Anda. Tapi mungkin Anda harus bertanya pada diri sendiri apakah itu hasil terbaik yang bisa Anda raih. Sudahkah Anda mencoba mencari lebih banyak data? Mungkin menambahkan data ramalan cuaca ke variabel penjualan reguler yang Anda gunakan dalam model ARIMA Anda akan membantu Anda untuk meramalkan penjualan Anda dengan lebih baik. Atau mungkin beberapa fitur di sekitar hari libur dapat memberi tahu model Anda mengapa pembeli Anda bersikap dengan cara tertentu sekitar Thanksgiving atau Natal.

Salah satu cara untuk mengurangi bias ini adalah dengan berpikir secara ilmiah dan ketat tentang masalah yang ada dan kemudian melakukan brainstorming tentang segala jenis data yang dapat membantu menyelesaikannya (bukan hanya mulai dengan data). Pendekatan-pendekatan ini mungkin tampak serupa, tetapi metode kedua membatasi visi Anda karena Anda tidak tahu apa yang hilang dari pekerjaan Anda. Dengan menggunakan pendekatan pertama, Anda akan tahu data apa yang tidak bisa Anda dapatkan, dan Anda akhirnya akan memasukkan faktor itu ke dalam kesimpulan Anda.

Tenggelam kesalahan biaya
Kita semua telah melihat kekeliruan biaya sunk beraksi di beberapa titik, apakah itu duduk melalui film yang buruk karena kita telah membayar untuk itu atau menyelesaikan buku yang mengerikan itu karena kita sudah setengah jalan. Setiap orang telah berada dalam situasi di mana mereka pada akhirnya membuang lebih banyak waktu karena mereka berusaha menyelamatkan waktu yang telah mereka investasikan. Biaya hangus, juga dikenal sebagai biaya retrospektif , adalah biaya yang telah dikeluarkan dan tidak dapat dipulihkan dengan tindakan tambahan apa pun. Kekeliruan biaya sunk mengacu pada kecenderungan manusia untuk membuat keputusan berdasarkan berapa banyak investasi yang telah mereka buat, yang mengarah pada investasi yang lebih banyak tetapi tidak ada pengembalian apa pun. Terkadang, sesulit apa pun, hal terbaik untuk dilakukan adalah melepaskan.

Ini sering terjadi dengan proyek ilmu data. Sebuah proyek mungkin berjalan selama lebih dari dua tahun tanpa hasil tetapi penyelidik terus menjalankannya karena begitu banyak waktu, uang, dan usaha telah diinvestasikan. Atau seorang ilmuwan data dapat mempertahankan proyeknya dengan sepenuh hati karena dia telah berinvestasi begitu banyak di dalamnya, gagal menyadari bahwa memasukkan lebih banyak pekerjaan tidak akan membantunya atau perusahaan dalam jangka panjang dan bahwa yang terbaik adalah jika proyek tersebut dibatalkan.

Cara untuk menyelamatkan diri dari bias kognitif ini adalah dengan berfokus pada manfaat dan biaya di masa depan daripada biaya yang sudah hilang di masa lalu. Anda harus mengembangkan kebiasaan itu, walaupun sulit, untuk mengabaikan informasi biaya sebelumnya. Tentu saja, tidak pernah mudah bagi kita para ilmuwan data untuk hanya mengabaikan data. Bagi saya sendiri, saya telah menemukan bahwa cara metodis bekerja paling baik dalam kasus ini. Saya mengambil pena dan kertas untuk menjauh dari semua gangguan dan mencoba memunculkan semua biaya tambahan yang diperlukan untuk melakukan proyek bersama dengan manfaat yang mungkin saya dapatkan di masa depan. Jika bagian biaya dari tugas tampaknya terlalu signifikan, maka sekarang saatnya untuk melanjutkan.

Kausalitas palsu
Sebagai ilmuwan data, kami selalu mencari pola. Kecenderungan berarti bahwa kadang-kadang kita bahkan menemukan pola di mana tidak ada yang benar-benar ada. Otak kita dilatih sedemikian rupa sehingga kita bahkan dapat membuat kekacauan sejauh yang kita bisa.

Karena pelatihan kita memaksa kita untuk mencari pola, penting untuk mengingat pepatah sederhana bahwa korelasi tidak menyiratkan sebab-akibat. Kelima kata itu seperti palu kotak ilmu data yang tanpanya Anda tidak bisa menyelesaikan apa pun. Hanya karena dua variabel bergerak bersama-sama tidak selalu berarti bahwa satu menyebabkan yang lain.

Prinsip ini telah dibuktikan dengan banyak contoh. Misalnya, dengan melihat data pemadam kebakaran, Anda memperhatikan bahwa, karena semakin banyak petugas pemadam kebakaran dikirim ke kebakaran, semakin banyak kerusakan yang akhirnya terjadi pada sebuah properti. Dengan demikian, Anda dapat menyimpulkan bahwa semakin banyak petugas pemadam kebakaran yang menyebabkan lebih banyak kerusakan. Dalam contoh terkenal lainnya, seorang akademisi yang sedang menyelidiki penyebab kejahatan di New York City pada 1980-an menemukan korelasi kuat antara jumlah kejahatan serius yang dilakukan dan jumlah es krim yang dijual oleh pedagang kaki lima. Tetapi haruskah kita menyimpulkan bahwa makan es krim membuat orang melakukan kejahatan? Karena ini tidak masuk akal, kita seharusnya curiga bahwa ada variabel yang tidak diamati yang menyebabkan keduanya. Selama musim panas, tingkat kejahatan adalah yang tertinggi, dan ini juga saat sebagian besar es krim dijual. Penjualan es krim tidak menyebabkan kejahatan, kejahatan juga tidak meningkatkan penjualan es krim. Dalam kedua contoh ini, melihat data terlalu dangkal mengarah pada asumsi yang salah.

Sebagai ilmuwan data, kita perlu memperhatikan bias ini ketika kami menyajikan temuan. Seringkali, variabel yang mungkin tampak kausal mungkin tidak dalam pemeriksaan lebih dekat. Kami juga harus berhati-hati untuk menghindari kesalahan jenis ini saat membuat variabel model kami. Pada setiap langkah proses, penting untuk bertanya pada diri sendiri apakah variabel independen kami mungkin hanya berkorelasi dengan variabel dependen.

Bias ketersediaan
Pernahkah Anda mengatakan sesuatu seperti, “Saya tahu itu [masukkan pernyataan umum di sini] karena [masukkan satu contoh tunggal].” Misalnya, seseorang mungkin berkata, “Kamu tidak bisa menjadi gemuk karena minum bir, karena Bob banyak minum, dan dia kurus.” Jika sudah, maka Anda menderita bias ketersediaan. Anda mencoba memahami dunia dengan data yang terbatas.

Orang secara alami cenderung mendasarkan keputusan pada informasi yang sudah tersedia bagi kita atau hal-hal yang sering kita dengar tanpa melihat alternatif yang mungkin berguna. Sebagai hasilnya, kami membatasi diri kami pada subset informasi yang sangat spesifik.

Ini sering terjadi di dunia ilmu data. Para ilmuwan data cenderung mendapatkan dan mengerjakan data yang lebih

mudah diperoleh daripada mencari data yang lebih sulit untuk dikumpulkan tetapi mungkin lebih bermanfaat. Kami puas dengan model-model yang kami pahami dan tersedia bagi kami dalam paket yang rapi dan bukan sesuatu yang lebih cocok untuk masalah yang dihadapi tetapi jauh lebih sulit didapat.

Cara untuk mengatasi bias ketersediaan dalam ilmu data adalah dengan memperluas wawasan kita. Berkomitmen untuk belajar seumur hidup. Baca. Banyak. Tentang semuanya. Kemudian baca lagi. Bertemu orang baru. Diskusikan pekerjaan Anda dengan ilmuwan data lain di tempat kerja atau di forum online. Lebih terbuka terhadap saran tentang perubahan yang mungkin harus Anda ambil dalam pendekatan Anda. Dengan membuka diri terhadap informasi dan ide-ide baru, Anda dapat memastikan bahwa Anda cenderung bekerja dengan informasi yang tidak lengkap.

Bias konfirmasi
Lelucon lama mengatakan bahwa jika Anda menyiksa data cukup lama, itu akan mengaku. Dengan kerja yang cukup, Anda dapat mengubah data untuk membuatnya mengatakan apa yang Anda inginkan.

Kita semua memiliki keyakinan, dan itu tidak masalah. Itu semua adalah bagian dari manusia. Namun, yang tidak beres adalah ketika kita membiarkan keyakinan itu secara tidak sengaja masuk ke dalam cara kita membentuk hipotesis kita.

Kita dapat melihat kecenderungan ini dalam kehidupan kita sehari-hari. Kami sering menafsirkan informasi baru

sedemikian rupa sehingga menjadi kompatibel dengan keyakinan kami sendiri. Kami membaca berita di situs yang paling sesuai dengan kepercayaan kami. Kami berbicara dengan orang-orang yang seperti kami dan memiliki pandangan yang sama. Kami tidak ingin mendapatkan bukti yang membingungkan karena itu mungkin membuat kami mengubah pandangan dunia kami, yang mungkin takut kami lakukan.

Sebagai contoh, saya telah melihat bias konfirmasi dalam tindakan dalam ilmu data selama tahap analisis biaya-manfaat dari suatu proyek. Saya telah melihat orang-orang menempel pada data yang mengkonfirmasi hipotesis mereka sambil mengabaikan semua bukti yang bertentangan. Jelas, melakukan ini bisa berdampak negatif pada bagian manfaat proyek.

Salah satu cara untuk melawan bias ini adalah dengan memeriksa secara kritis semua kepercayaan Anda dan mencoba menemukan bukti yang membingungkan tentang masing-masing teori Anda. Maksud saya, secara aktif mencari bukti dengan pergi ke tempat-tempat di mana Anda biasanya tidak pergi, berbicara dengan orang-orang yang biasanya tidak Anda ajak bicara, dan umumnya tetap berpikiran terbuka.

Di zaman kita yang penuh dengan informasi, kita dikelilingi oleh begitu banyak data sehingga otak kita berusaha

mati-matian untuk memahami kebisingan. Terkadang berguna untuk memahami dunia berdasarkan informasi yang terbatas. Bahkan, kita membuat sebagian besar keputusan tanpa banyak berpikir, mengikuti perasaan kita. Potensi bahaya dari sebagian besar tindakan kita sehari-hari cukup kecil. Namun, membiarkan bias kita memengaruhi pekerjaan kita, dapat meninggalkan kita dalam situasi yang tidak menguntungkan. Kita mungkin pada akhirnya kehilangan uang atau kredibilitas jika kita membuat keputusan penting yang ternyata salah.

Mengetahui cara kerja otak kita akan membantu kita menghindari kesalahan ini.

Sumber:

https://icanhasmotivation.com/watchmaker-face-apk/