Visi komputer jaringan saraf akurat tanpa 'kotak hitam'
Computer

Visi komputer jaringan saraf akurat tanpa ‘kotak hitam’


Penelitian baru menawarkan petunjuk tentang apa yang terjadi di dalam benak mesin saat mereka belajar melihat. Sebuah metode yang dikembangkan oleh laboratorium Cynthia Rudin mengungkapkan seberapa banyak jaringan saraf mengingat konsep yang berbeda saat gambar bergerak melalui lapisan jaringan. Kredit: Sekolah Keperawatan Universitas Duke

Kecerdasan buatan di balik mobil self-driving, analisis citra medis, dan aplikasi penglihatan komputer lainnya bergantung pada apa yang disebut jaringan saraf dalam.

Dimodelkan secara longgar di otak, ini terdiri dari lapisan “neuron” yang saling berhubungan — fungsi matematika yang mengirim dan menerima informasi — yang “menyala” sebagai respons terhadap fitur data masukan. Lapisan pertama memproses input data mentah — seperti piksel dalam gambar — dan meneruskan informasi tersebut ke lapisan berikutnya di atas, memicu beberapa neuron tersebut, yang kemudian meneruskan sinyal ke lapisan yang lebih tinggi hingga akhirnya tiba pada penentuan apa ada di gambar masukan.

Tapi inilah masalahnya, kata profesor ilmu komputer Duke Cynthia Rudin. “Kami dapat memasukkan, katakanlah, gambar medis, dan mengamati apa yang keluar dari ujung yang lain (‘ini adalah gambar lesi ganas’, tetapi sulit untuk mengetahui apa yang terjadi di antaranya.”

Itu yang dikenal sebagai masalah “kotak hitam”. Apa yang terjadi dalam benak mesin — lapisan tersembunyi jaringan — sering kali tidak dapat dipahami, bahkan oleh orang yang membuatnya.

“Masalah dengan model pembelajaran yang dalam adalah mereka sangat kompleks sehingga kita tidak benar-benar tahu apa yang mereka pelajari,” kata Zhi Chen, Ph.D. siswa di lab Rudin di Duke. “Mereka sering kali dapat memanfaatkan informasi yang tidak kita inginkan. Proses penalaran mereka bisa sepenuhnya salah.”

Sarjana Rudin, Chen dan Duke Yijie Bei telah menemukan cara untuk mengatasi masalah ini. Dengan memodifikasi proses penalaran di balik prediksi, mungkin peneliti dapat memecahkan masalah jaringan dengan lebih baik atau memahami apakah mereka dapat dipercaya.

Sebagian besar pendekatan mencoba untuk mengungkap apa yang membuat sistem computer vision ke jawaban yang benar setelah fakta, dengan menunjuk ke fitur atau piksel utama yang mengidentifikasi gambar: “Pertumbuhan pada rontgen dada ini diklasifikasikan sebagai ganas karena, pada modelnya , area ini sangat penting dalam klasifikasi kanker paru-paru. ” Pendekatan semacam itu tidak mengungkapkan alasan jaringan, hanya di mana ia mencarinya.

Tim Duke mencoba cara lain. Alih-alih mencoba memperhitungkan pengambilan keputusan jaringan secara post hoc, metode mereka melatih jaringan untuk menunjukkan pekerjaannya dengan mengungkapkan pemahamannya tentang konsep di sepanjang jalan. Metode mereka bekerja dengan mengungkapkan seberapa banyak jaringan mengingat konsep yang berbeda untuk membantu menguraikan apa yang dilihatnya. “Ini menguraikan bagaimana berbagai konsep direpresentasikan dalam lapisan jaringan,” kata Rudin.

Diberikan gambar perpustakaan, misalnya, pendekatan memungkinkan untuk menentukan apakah dan seberapa banyak lapisan yang berbeda dari jaringan saraf bergantung pada representasi mental mereka dari “buku” untuk mengidentifikasi pemandangan.

Kredit: Sekolah Keperawatan Universitas Duke

Para peneliti menemukan bahwa, dengan sedikit penyesuaian pada jaringan saraf, dimungkinkan untuk mengidentifikasi objek dan pemandangan dalam gambar seakurat jaringan asli, namun mendapatkan interpretabilitas yang substansial dalam proses penalaran jaringan. “Tekniknya sangat sederhana untuk diterapkan,” kata Rudin.

Metode ini mengontrol cara informasi mengalir melalui jaringan. Ini melibatkan penggantian satu bagian standar jaringan saraf dengan bagian baru. Bagian baru ini hanya membatasi satu neuron dalam jaringan untuk bekerja sebagai respons terhadap konsep tertentu yang dipahami manusia. Konsepnya bisa berupa kategori benda sehari-hari, seperti “buku” atau “sepeda.” Tapi bisa juga karakteristik umum, seperti “logam”, “kayu”, “dingin” atau “hangat”. Dengan hanya memiliki satu neuron yang mengontrol informasi tentang satu konsep pada satu waktu, jauh lebih mudah untuk memahami bagaimana jaringan “berpikir”.

Para peneliti mencoba pendekatan mereka pada jaringan saraf yang dilatih oleh jutaan gambar berlabel untuk mengenali berbagai jenis pemandangan di dalam dan luar ruangan, dari ruang kelas dan pujasera hingga taman bermain dan teras. Kemudian mereka menyalakannya pada gambar yang belum pernah dilihat sebelumnya. Mereka juga melihat untuk melihat konsep mana yang paling banyak digunakan oleh lapisan jaringan saat mereka memproses data.

Chen menarik plot yang menunjukkan apa yang terjadi ketika mereka memasukkan gambar matahari terbenam oranye ke jaringan. Jaringan saraf terlatih mereka mengatakan bahwa warna hangat pada citra matahari terbenam, seperti jingga, cenderung dikaitkan dengan konsep “tempat tidur” di lapisan jaringan sebelumnya. Singkatnya, jaringan mengaktifkan “neuron tempat tidur” di lapisan awal. Saat gambar bergerak melalui lapisan yang berurutan, jaringan secara bertahap mengandalkan representasi mental yang lebih canggih dari setiap konsep, dan konsep “pesawat” menjadi lebih aktif daripada gagasan tentang tempat tidur, mungkin karena “pesawat terbang” lebih sering dikaitkan dengan langit dan awan .

Itu hanya sebagian kecil dari apa yang sedang terjadi, untuk memastikannya. Tetapi dari lintasan ini para peneliti dapat menangkap aspek-aspek penting dari alur pemikiran jaringan.

Para peneliti mengatakan modul mereka dapat dihubungkan ke jaringan saraf apa pun yang mengenali gambar. Dalam satu percobaan, mereka menghubungkannya ke jaringan saraf yang terlatih untuk mendeteksi kanker kulit dalam foto.

Sebelum AI dapat belajar mengenali melanoma, AI harus mempelajari apa yang membuat melanoma terlihat berbeda dari tahi lalat normal dan bintik jinak lainnya pada kulit Anda, dengan menyaring ribuan gambar pelatihan yang diberi label dan ditandai oleh ahli kanker kulit.

Tetapi jaringan tersebut tampaknya memunculkan konsep “perbatasan tidak beraturan” yang dibentuknya sendiri, tanpa bantuan dari label pelatihan. Orang-orang yang membuat anotasi gambar untuk digunakan dalam aplikasi kecerdasan buatan tidak membuat catatan tentang fitur itu, tetapi mesin melakukannya.

“Metode kami menemukan kekurangan dalam dataset,” kata Rudin. Mungkin jika mereka memasukkan informasi ini ke dalam data, itu akan memperjelas apakah model itu bernalar dengan benar. “Contoh ini hanya menggambarkan mengapa kita tidak boleh menaruh kepercayaan buta pada model” kotak hitam “tanpa petunjuk tentang apa yang terjadi di dalamnya, terutama untuk diagnosis medis yang rumit,” kata Rudin.

Pekerjaan tim muncul 7 Desember di jurnal Kecerdasan Mesin Alam.


Pengamat burung AI ini memungkinkan Anda ‘melihat’ melalui mata mesin


Informasi lebih lanjut:
Zhi Chen et al, Pemutihan konsep untuk pengenalan gambar yang dapat diinterpretasikan, Kecerdasan Mesin Alam (2020). DOI: 10.1038 / s42256-020-00265-z

Disediakan oleh Duke University School of Nursing

Kutipan: Visi komputer jaringan saraf akurat tanpa ‘kotak hitam’ (2020, 15 Desember) diambil pada 15 Desember 2020 dari https://techxplore.com/news/2020-12-accurate-neural-network-vision-black.html

Dokumen ini memiliki hak cipta. Selain dari transaksi yang adil untuk tujuan studi atau penelitian pribadi, tidak ada bagian yang boleh direproduksi tanpa izin tertulis. Konten disediakan untuk tujuan informasi saja.




Halaman Ini Di Persembahkan Oleh : Pengeluaran HK