Mari kita bicara tentang gajah dalam data
Sciences

Mari kita bicara tentang gajah dalam data


Render artistik tentang bagaimana komputer dapat mengidentifikasi seekor gajah. Kredit: Ben Wigler/CSHL, 2021

Anda tidak akan terkejut melihat gajah di sabana atau piring di dapur Anda. Berdasarkan pengalaman dan pengetahuan Anda sebelumnya, Anda tahu di situlah gajah dan piring sering ditemukan. Jika Anda melihat benda misterius di dapur Anda, bagaimana Anda mengetahui benda itu? Anda akan bergantung pada harapan Anda atau pengetahuan sebelumnya. Haruskah komputer mendekati masalah dengan cara yang sama? Jawabannya mungkin mengejutkan Anda. Profesor Laboratorium Cold Spring Harbor Partha Mitra menggambarkan bagaimana dia memandang masalah seperti ini dalam “Perspektif” di Kecerdasan Mesin Alam. Dia berharap wawasannya akan membantu para peneliti mengajar komputer bagaimana menganalisis sistem yang kompleks dengan lebih efektif.

Mitra berpikir itu membantu untuk memahami sifat pengetahuan. Berbicara secara matematis, banyak ilmuwan data mencoba membuat model yang “cocok dengan gajah”, atau sekumpulan titik data yang kompleks. Mitra meminta peneliti untuk mempertimbangkan kerangka filosofis apa yang paling cocok untuk tugas pembelajaran mesin tertentu: “Dalam istilah filosofis, idenya adalah bahwa ada dua ekstrem ini. Satu, Anda bisa mengatakan “rasionalis”, dan yang lainnya, poin “empiris”. pandangan. Dan sungguh, ini tentang peran pengetahuan sebelumnya atau asumsi sebelumnya.”

Rasionalis versus empiris

Seorang rasionalis memandang dunia melalui lensa pengetahuan sebelumnya. Mereka mengharapkan piring di dapur dan gajah di sabana.

Seorang empiris menganalisis data persis seperti yang disajikan. Ketika mereka mengunjungi sabana, mereka tidak lagi berharap melihat gajah selain piring.

Jika seorang rasionalis menemukan kumpulan titik data ini di dapur, mereka mungkin pada awalnya cenderung melihatnya sebagai piring. Pengetahuan mereka sebelumnya menyatakan bahwa piring mungkin ditemukan di dapur; sangat tidak mungkin untuk menemukan gajah. Mereka belum pernah melihat situasi ini sebelumnya, mereka juga tidak pernah belajar bahwa situasi seperti itu bisa terjadi. Meskipun hasil mereka mengambil sejumlah data tertentu, itu meninggalkan bagian lain. Dalam hal ini, metode mereka telah menghasilkan hasil yang salah: piring.

Mari kita bicara tentang gajah dalam data

‘Data’ di dapur Anda. Kredit: Ben Wigler

Ketika seorang empiris melihat data yang sama, mereka akan menganalisisnya tanpa memperhatikan apakah mereka berada di sabana atau dapur mereka. Mereka akan mengumpulkan gambar dari titik data sebanyak mungkin. Dalam hal ini, hasilnya adalah gambar bergerigi. Itu tidak memberitahu empiris jika mereka sedang melihat gajah, piring, atau apa pun.

Baik empiris maupun rasionalis tidak salah. Kedua pendekatan bekerja untuk berbagai jenis masalah. Namun, dalam kasus ini, jika ada seekor gajah di dapur, akan ada gunanya mencari tahu secepat mungkin. Jalan tengah antara pendekatan empiris murni dan rasionalis murni mungkin yang terbaik. Dengan beberapa pengetahuan sebelumnya tentang seperti apa gajah itu, Anda mungkin memperhatikan belalai dan kakinya. Dan meskipun kemungkinan seekor gajah berada di dapur Anda kecil, itu tentu bukan tidak mungkin. Oleh karena itu, Anda akan sampai pada kesimpulan bahwa memang ada seekor gajah di dapur Anda, dan Anda mungkin harus pergi—cepat.

Bisa ditebak tapi salah

Ilmuwan data menghadapi masalah semacam ini sepanjang waktu. Mereka melatih komputer untuk mengenali objek atau pola baru. Beberapa program pembelajaran mesin mungkin dapat memproses banyak informasi dan membuat banyak aturan agar sesuai dengan data yang disajikan, seperti gambar bergerigi di atas. Gambar bergerigi mungkin dapat direproduksi ketika aturan yang sama diterapkan ke kumpulan data serupa lainnya. Tetapi hanya karena polanya dapat direproduksi, itu tidak berarti secara akurat mewakili apa yang terjadi (gajah).

Ada contoh historis dari dilema ini. Dua ribu tahun yang lalu, Ptolemy mengembangkan model alam semesta yang menghasilkan prediksi yang sangat baik untuk pergerakan bulan dan planet. Modelnya berhasil digunakan selama berabad-abad. Namun, Ptolemy menggunakan informasi sebelumnya yang salah: Dia menempatkan Bumi di pusat tata surya dan memprioritaskan gerakan melingkar benda-benda langit. Johannes Kepler mempertanyakan pandangan ini pada abad ke-17 dan akhirnya menolak pendekatan Ptolemy, yang akhirnya mengarah pada hukum gravitasi universal Newton. Meskipun model kompleks Ptolemy sangat cocok dengan pengamatannya sendiri, model tersebut tidak secara akurat mewakili apa yang sedang terjadi. Mitra memperingatkan bahwa “jika Anda ingin menjadi seorang empiris ekstrim, Anda benar-benar membutuhkan banyak data. Kami sekarang mengerti mengapa dalam keadaan tertentu, pendekatan seperti itu, pada kenyataannya, dapat berhasil dalam pengaturan matematis yang ketat. Otak biologis, di sisi lain, berada di tengah jalan. Anda memang belajar dari pengalaman, tetapi Anda tidak sepenuhnya didorong oleh data.”

Mari kita bicara tentang gajah dalam data

Batang, kaki: pasti gajah! Kredit: Ben Wigler

Mitra berharap para ilmuwan data akan melihat ke sirkuit otak untuk mendapatkan inspirasi saat mengembangkan pendekatan pembelajaran mesin generasi berikutnya. Otak vertebrata memiliki sirkuit dengan ukuran berbeda, termasuk yang berukuran sedang (mesoscale). Sirkuit tersebut dikodekan dengan prior (informasi yang diketahui, seperti seperti apa bentuk hewan, di mana mereka ditemukan, atau cara melarikan diri dengan cepat dari gajah yang menyerang). Pada saat yang sama, otak Anda sangat fleksibel, mengklasifikasikan informasi baru dan menimbang pentingnya prioritas yang berbeda berdasarkan pengalaman—gajah mungkin tidak termasuk dalam dapur, tetapi bagaimanapun, Anda tetap memilikinya.

Mitra menyimpulkan dalam artikelnya, “Ini menunjukkan kemungkinan generasi baru mesin cerdas berdasarkan arsitektur sirkuit terdistribusi yang menggabungkan prior yang lebih kuat, mungkin memanfaatkan arsitektur sirkuit mesoscale dari otak vertebrata.”


AI belajar melacak jalur saraf


Informasi lebih lanjut:
Partha P. Mitra, Memasang gajah dalam pembelajaran mesin modern dengan interpolasi yang konsisten secara statistik, Kecerdasan Mesin Alam (2021). DOI: 10.1038 / s42256-021-00345-8

Disediakan oleh Cold Spring Harbor Laboratory

Kutipan: Mari kita bicara tentang gajah dalam data (2021, 3 Juni) diambil 3 Juni 2021 dari https://techxplore.com/news/2021-06-elephant.html

Dokumen ini tunduk pada hak cipta. Terlepas dari transaksi wajar apa pun untuk tujuan studi atau penelitian pribadi, tidak ada bagian yang boleh direproduksi tanpa izin tertulis. Konten disediakan untuk tujuan informasi saja.


Halaman Ini Di Persembahkan Oleh : Hongkong Prize