Ahli saraf menemukan cara untuk membuat model pengenalan objek bekerja lebih baik
Machine

Ahli saraf menemukan cara untuk membuat model pengenalan objek bekerja lebih baik


Ilmuwan saraf MIT telah mengembangkan cara untuk mengatasi kerentanan model visi komputer terhadap “serangan permusuhan”, dengan menambahkan ke model ini lapisan baru yang dirancang untuk meniru V1, tahap paling awal dari sistem pemrosesan visual otak. Kredit: MIT News.

Model visi komputer yang dikenal sebagai jaringan saraf konvolusional dapat dilatih untuk mengenali objek hampir seakurat manusia. Namun, model ini memiliki satu kekurangan yang signifikan: Perubahan yang sangat kecil pada gambar, yang hampir tidak terlihat oleh pengamat manusia, dapat mengelabui mereka untuk membuat kesalahan yang parah seperti mengklasifikasikan kucing sebagai pohon.

Sebuah tim ahli saraf dari MIT, Universitas Harvard, dan IBM telah mengembangkan cara untuk mengatasi kerentanan ini, dengan menambahkan lapisan baru ke model ini yang dirancang untuk meniru tahap paling awal dari sistem pemrosesan visual otak. Dalam studi baru, mereka menunjukkan bahwa lapisan ini sangat meningkatkan ketahanan model terhadap jenis kesalahan ini.

“Hanya dengan membuat model lebih mirip dengan korteks visual utama otak, dalam satu tahap pemrosesan ini, kami melihat peningkatan yang cukup signifikan dalam ketahanan di berbagai jenis gangguan dan kerusakan,” kata Tiago Marques, seorang postdoc MIT dan salah satu dari penulis utama studi ini.

Jaringan saraf konvolusional sering digunakan dalam aplikasi kecerdasan buatan seperti mobil tanpa pengemudi, jalur perakitan otomatis, dan diagnostik medis. Mahasiswa pascasarjana Harvard, Joel Dapello, yang juga penulis utama studi ini, menambahkan bahwa “menerapkan pendekatan baru kami berpotensi membuat sistem ini tidak terlalu rentan terhadap kesalahan dan lebih selaras dengan penglihatan manusia.”

“Hipotesis ilmiah yang baik tentang bagaimana sistem visual otak bekerja, menurut definisi, harus cocok dengan otak baik dalam pola saraf internalnya maupun dalam kekokohannya yang luar biasa. Studi ini menunjukkan bahwa pencapaian hasil ilmiah tersebut secara langsung mengarah pada keuntungan rekayasa dan penerapan,” kata James DiCarlo , Kepala Departemen Ilmu Otak dan Kognitif MIT, seorang penyelidik di Pusat Otak, Pikiran, dan Mesin dan Institut McGovern untuk Riset Otak, dan penulis senior studi tersebut.

Penelitian, yang dipresentasikan pada konferensi NeurIPS bulan ini, juga ditulis bersama oleh mahasiswa pascasarjana MIT Martin Schrimpf, mahasiswa tamu MIT Franziska Geiger, dan Direktur Lab AI MIT-IBM Watson David Cox.

Ahli saraf menemukan cara untuk membuat model pengenalan objek bekerja lebih baik

Perbandingan gambar permusuhan dengan kekuatan gangguan yang berbeda. Kredit: Institut Teknologi Massachusetts

Meniru otak

Mengenali objek adalah salah satu fungsi utama sistem visual. Hanya dalam sepersekian detik, informasi visual mengalir melalui aliran visual ventral ke korteks temporal inferior otak, tempat neuron berisi informasi yang diperlukan untuk mengklasifikasikan objek. Pada setiap tahap dalam aliran ventral, otak melakukan berbagai jenis pemrosesan. Tahap paling pertama dalam aliran ventral, V1, adalah salah satu bagian otak yang paling baik dan berisi neuron yang merespons fitur visual sederhana seperti tepian.

“Diperkirakan bahwa V1 mendeteksi tepi atau kontur lokal objek, dan tekstur, dan melakukan beberapa jenis segmentasi gambar dalam skala yang sangat kecil. Kemudian informasi tersebut kemudian digunakan untuk mengidentifikasi bentuk dan tekstur objek di hilir,” kata Marques . “Sistem visual dibangun dengan cara hierarkis ini, di mana pada tahap awal neuron merespons fitur lokal seperti tepi yang kecil dan memanjang.”

Selama bertahun-tahun, para peneliti telah mencoba membangun model komputer yang dapat mengidentifikasi objek serta sistem visual manusia. Sistem penglihatan komputer terdepan saat ini sudah dipandu secara longgar oleh pengetahuan kita saat ini tentang pemrosesan visual otak. Namun, ahli saraf masih belum cukup tahu tentang bagaimana seluruh aliran visual ventral terhubung untuk membuat model yang persis menirunya, jadi mereka meminjam teknik dari bidang pembelajaran mesin untuk melatih jaringan saraf konvolusional pada serangkaian tugas tertentu. Dengan menggunakan proses ini, model dapat belajar mengidentifikasi objek setelah dilatih pada jutaan gambar.

Banyak dari jaringan konvolusional ini berkinerja sangat baik, tetapi dalam banyak kasus, peneliti tidak tahu persis bagaimana jaringan menyelesaikan tugas pengenalan objek. Pada 2013, para peneliti dari laboratorium DiCarlo menunjukkan bahwa beberapa jaringan saraf ini tidak hanya dapat mengidentifikasi objek secara akurat, tetapi juga dapat memprediksi bagaimana neuron di otak primata akan merespons objek yang sama jauh lebih baik daripada model alternatif yang ada. Namun, jaringan saraf ini masih belum dapat memprediksi respons dengan sempurna di sepanjang aliran visual ventral, terutama pada tahap paling awal pengenalan objek, seperti V1.

Ahli saraf menemukan cara untuk membuat model pengenalan objek bekerja lebih baik

Petak yang menunjukkan visualisasi berbagai jenis kerusakan gambar yang umum. Baris pertama, gambar asli, diikuti oleh kerusakan noise; baris kedua, mengaburkan korupsi; baris ketiga, kerusakan cuaca; baris keempat, korupsi digital. Kredit: Institut Teknologi Massachusetts

Model-model ini juga rentan terhadap apa yang disebut “serangan musuh”. Ini berarti bahwa perubahan kecil pada gambar, seperti mengubah warna beberapa piksel, dapat membuat model benar-benar membingungkan objek untuk sesuatu yang berbeda — jenis kesalahan yang tidak akan dilakukan oleh pengamat manusia.

Sebagai langkah pertama dalam studi mereka, para peneliti menganalisis kinerja 30 model ini dan menemukan bahwa model yang respons internalnya lebih cocok dengan respons V1 otak juga kurang rentan terhadap serangan musuh. Artinya, memiliki V1 yang lebih mirip otak sepertinya membuat modelnya lebih kokoh. Untuk menguji lebih lanjut dan memanfaatkan gagasan itu, para peneliti memutuskan untuk membuat model V1 mereka sendiri, berdasarkan model ilmu saraf yang ada, dan menempatkannya di depan jaringan saraf konvolusional yang telah dikembangkan untuk melakukan pengenalan objek.

Ketika peneliti menambahkan lapisan V1 mereka, yang juga diimplementasikan sebagai jaringan saraf konvolusional, ke tiga model ini, mereka menemukan bahwa model ini menjadi sekitar empat kali lebih tahan untuk membuat kesalahan pada gambar yang terganggu oleh serangan permusuhan. Model tersebut juga kurang rentan terhadap kesalahan identifikasi objek yang buram atau terdistorsi karena kerusakan lainnya.

“Serangan musuh adalah masalah besar dan terbuka untuk penerapan praktis jaringan saraf dalam. Fakta bahwa menambahkan elemen yang terinspirasi ilmu saraf dapat meningkatkan ketahanan secara substansial menunjukkan bahwa masih banyak yang dapat dipelajari AI dari ilmu saraf, dan sebaliknya,” Cox kata.


Jaringan saraf konvolusional dapat diakali dengan ilusi visual yang sama dengan manusia


Informasi lebih lanjut:
Mensimulasikan Korteks Visual Utama di Depan CNN Meningkatkan Kekokohan pada Gangguan Gambar. prosiding.neurips.cc/paper/2… 470841-Abstract.html

Disediakan oleh Massachusetts Institute of Technology

Kisah ini diterbitkan ulang atas izin MIT News (web.mit.edu/newsoffice/), situs populer yang meliput berita tentang penelitian, inovasi, dan pengajaran MIT.

Kutipan: Ahli saraf menemukan cara untuk membuat model pengenalan objek berkinerja lebih baik (2020, 3 Desember), diakses pada 3 Desember 2020 dari https://techxplore.com/news/2020-12-neuroscientists-object-recognition.html

Dokumen ini memiliki hak cipta. Selain dari transaksi yang adil untuk tujuan studi atau penelitian pribadi, tidak ada bagian yang boleh direproduksi tanpa izin tertulis. Konten disediakan untuk tujuan informasi saja.


Halaman Ini Di Persembahkan Oleh : Result SGP