Kemajuan baru dalam mendeteksi bias dalam algoritma pengenalan wajah
Computer

Suatu teknik untuk memperkirakan valensi dan gairah emosional dengan menganalisis gambar wajah manusia


Kredit: CC0

Dalam beberapa tahun terakhir, ilmuwan komputer yang tak terhitung jumlahnya di seluruh dunia telah mengembangkan model berbasis jaringan saraf dalam yang dapat memprediksi emosi orang berdasarkan ekspresi wajah mereka. Sebagian besar model yang dikembangkan sejauh ini, bagaimanapun, hanya mendeteksi keadaan emosi utama seperti kemarahan, kebahagiaan dan kesedihan, daripada aspek emosi manusia yang lebih halus.

Penelitian psikologi masa lalu, di sisi lain, telah menggambarkan banyak dimensi emosi, misalnya, memperkenalkan ukuran seperti valensi (yaitu, seberapa positif tampilan emosional) dan gairah (yaitu, seberapa tenang atau bersemangat seseorang saat mengekspresikan emosi) . Meskipun memperkirakan valensi dan gairah hanya dengan melihat wajah orang itu mudah bagi kebanyakan manusia, ini bisa menjadi tantangan bagi mesin.

Para peneliti di Samsung AI dan Imperial College London baru-baru ini mengembangkan sistem berbasis jaringan saraf dalam yang dapat memperkirakan valensi dan gairah emosional dengan tingkat akurasi tinggi hanya dengan menganalisis gambar wajah manusia yang diambil dalam pengaturan sehari-hari. Model ini, disajikan dalam makalah yang diterbitkan di Kecerdasan Mesin Alam, dapat membuat prediksi dengan cukup cepat, yang artinya dapat digunakan untuk mendeteksi kualitas halus emosi secara real time (misalnya, dari snapshot kamera CCTV).

“Setelah lama bekerja pada masalah perkiraan pengaruh, menjadi jelas bagi kami bahwa secara umum, kelas-kelas pengaruh emosional yang terpisah terlalu terbatas untuk mewakili kisaran pengaruh yang ditampilkan oleh manusia setiap hari,” para peneliti yang melakukan penelitian tersebut. studi tersebut mengatakan kepada TechXplore melalui email. “Akibatnya, kami mengalihkan fokus kami ke ukuran dimensi yang lebih umum dari pengaruh, yaitu valensi dan gairah.”

Selain perangkat keras berkinerja tinggi, membangun sistem pembelajaran mesin membutuhkan dua bahan dasar: kumpulan data dan algoritme yang sesuai. Dalam studi sebelumnya, tim peneliti di Samsung AI dan Imperial College mengumpulkan kumpulan data yang dapat digunakan untuk melatih jaringan saraf dalam untuk pengenalan emosi, termasuk kumpulan data AFEW-VA dan SEWA.

“Saat membuat set data AFEW-VA, kami menunjukkan bahwa untuk mendapatkan metode yang bekerja secara naturalistik, berlawanan dengan kondisi laboratorium terkontrol, data yang melatih metode tersebut juga harus dikumpulkan di alam liar,” kata para peneliti. “Demikian pula, budaya memainkan peran penting, seperti yang kami tunjukkan dalam proyek SEWA.”

Setelah mereka mengumpulkan kumpulan data yang berisi gambar wajah manusia yang diambil dalam pengaturan dunia nyata, para peneliti mengembangkan model yang menggabungkan pendekatan pengenalan emosi tradisional dengan teori terkait emosi lainnya. Arsitektur pembelajaran mendalam yang mereka buat dapat memperkirakan valensi dan gairah dengan tingkat akurasi yang tinggi hanya dengan memproses gambar wajah manusia. Selain itu, ini bekerja dengan baik saat gambar ini diambil di lab dan saat diambil dalam pengaturan dunia nyata.

Kredit: Toisoul et al.

“Tujuan utama dari metode kami adalah, dengan gambaran wajah seseorang, untuk memperkirakan valensi berkelanjutan (seberapa positif atau negatif keadaan pikiran) dan tingkat gairah (seberapa menenangkan atau mengasyikkan pengalaman), andal dan dalam waktu nyata, “kata para peneliti.

Sistem baru dilatih pada gambar beranotasi yang berisi informasi tentang valensi dan gairah. Selain itu, ia menganalisis ekspresi wajah menggunakan “landmark” tertentu, seperti lokasi bibir, hidung, dan mata seseorang, sebagai referensi. Ini memungkinkannya untuk fokus pada area wajah yang paling relevan untuk memperkirakan tingkat valensi dan gairah.

“Kami juga menggunakan label yang tersedia untuk kategori emosi diskrit sebagai tugas tambahan untuk memberikan pengawasan tambahan dan mendapatkan kinerja yang lebih baik pada tugas utama estimasi valensi dan gairah,” jelas para peneliti. “Untuk mencegah jaringan overfitting ke salah satu tugas, kami menggabungkannya menggunakan proses acak, regularisasi goyang-goyang.”

Dalam evaluasi awal, teknik deep learning mampu memperkirakan valensi dan gairah dari gambar wajah yang diambil dalam kondisi naturalistik dengan tingkat akurasi yang belum pernah terjadi sebelumnya. Hebatnya, ketika diuji pada set data AffectNet dan SEWA, sistemnya bekerja sebaik anotator manusia ahli.

“Jaringan kami mengungguli kesepakatan antara ahli anotator manusia pada dua kumpulan data,” kata para peneliti. “Dalam praktiknya, ini berarti bahwa jika jaringan dianggap sebagai anotator lain untuk kumpulan data ini, rata-rata kesepakatannya dengan anotator manusia setidaknya akan sebaik yang ada di antara anotator manusia lainnya, yang cukup luar biasa.”

Selain berkinerja baik, metode pembelajaran mendalam ini tidak mengganggu dan mudah diterapkan, karena mendasarkan prediksinya pada gambar sederhana yang diambil dengan kamera biasa. Ini membuatnya ideal untuk berbagai aplikasi. Misalnya, dapat digunakan untuk melakukan analisis pasar atau untuk membuat robot sosial yang lebih baik dalam memahami apa yang dirasakan manusia dan meresponsnya dengan tepat.

Sejauh ini, sistem berbasis jaringan saraf dalam hanya dilatih untuk menganalisis gambar statis. Meskipun secara teoritis juga dapat diterapkan pada footage video, untuk bekerja sama baiknya pada video, itu juga harus memperhitungkan korelasi temporal. Dalam pekerjaan mereka di masa depan, para peneliti berencana untuk mengembangkan sistem mereka lebih lanjut, sehingga dapat digunakan untuk memperkirakan valensi dan gairah emosional baik dari gambar dan video statis.

“Makalah yang kami presentasikan di CVPR 2020,” Factorized Higher-Order CNNs with an Application to Spatio-Temporal Emotion Estimation, “adalah langkah pertama untuk meningkatkan kinerja jaringan kami pada video,” kata para peneliti. “Secara khusus, kami merancang metode baru untuk melatih jaringan saraf pada gambar statis terlebih dahulu dan kemudian menggeneralisasi ke data spatio-temporal. Ini memiliki keuntungan dalam membuat pelatihan jaringan spasial-temporal lebih cepat sementara membutuhkan lebih sedikit data.”


Teknik pembelajaran mendalam untuk pengenalan emosi yang sadar konteks


Informasi lebih lanjut:
Estimasi tingkat valensi dan gairah berkelanjutan dari wajah dalam kondisi naturalistik. Kecerdasan Mesin Alam(2021). DOI: 10.1038 / s42256-020-00280-0.

© 2021 Science X Network

Kutipan: Teknik untuk memperkirakan valensi dan gairah emosional dengan menganalisis gambar wajah manusia (2021, 26 Januari) diambil pada 26 Januari 2021 dari https://techxplore.com/news/2021-01-technique-emotional-valence-arousal-images. html

Dokumen ini memiliki hak cipta. Selain dari transaksi yang adil untuk tujuan studi atau penelitian pribadi, tidak ada bagian yang boleh direproduksi tanpa izin tertulis. Konten disediakan untuk tujuan informasi saja.




Halaman Ini Di Persembahkan Oleh : Pengeluaran HK