Para ilmuwan mengadopsi pembelajaran mendalam untuk pelacakan multi-objek
Machine

Para ilmuwan mengadopsi pembelajaran mendalam untuk pelacakan multi-objek


Kerangka kerja baru mencapai kinerja mutakhir tanpa mengorbankan efisiensi dalam tugas pengawasan publik. Kredit: Institut Sains dan Teknologi Gwangju

Visi komputer telah berkembang pesat selama dekade terakhir dan masuk ke semua jenis aplikasi yang relevan, baik di dunia akademis maupun dalam kehidupan kita sehari-hari. Namun, ada beberapa tugas di bidang ini yang masih sangat sulit dilakukan oleh komputer dengan akurasi dan kecepatan yang dapat diterima. Salah satu contohnya adalah pelacakan objek, yang melibatkan pengenalan objek persisten dalam rekaman video dan melacak pergerakannya. Sementara komputer secara bersamaan dapat melacak lebih banyak objek daripada manusia, mereka biasanya gagal membedakan penampilan objek yang berbeda. Ini, pada gilirannya, dapat menyebabkan algoritme mencampur objek dalam sebuah adegan dan pada akhirnya menghasilkan hasil pelacakan yang salah.

Di Institut Sains dan Teknologi Gwangju di Korea, tim peneliti yang dipimpin oleh Profesor Moongu Jeon berusaha memecahkan masalah ini dengan memasukkan teknik pembelajaran mendalam ke dalam kerangka pelacakan multi-objek. Dalam sebuah penelitian terbaru yang diterbitkan di Ilmu Informasi, mereka menghadirkan model pelacakan baru berdasarkan teknik yang mereka sebut ‘asosiasi pencocokan penampilan temporal dalam (Deep-TAMA)’ yang menjanjikan solusi inovatif untuk beberapa masalah paling umum dalam pelacakan multi-objek.

Pendekatan pelacakan konvensional menentukan lintasan objek dengan mengaitkan kotak pembatas ke setiap objek yang terdeteksi dan menetapkan batasan geometris. Kesulitan yang melekat dalam pendekatan ini adalah dalam mencocokkan objek yang dilacak sebelumnya secara akurat dengan objek yang terdeteksi dalam bingkai saat ini. Membedakan objek yang terdeteksi berdasarkan fitur buatan tangan seperti warna biasanya gagal karena perubahan kondisi pencahayaan dan oklusi. Dengan demikian, para peneliti berfokus untuk mengaktifkan model pelacakan dengan kemampuan untuk secara akurat mengekstrak fitur yang diketahui dari objek yang terdeteksi dan membandingkannya tidak hanya dengan objek lain dalam bingkai tetapi juga dengan riwayat rekaman fitur yang diketahui. Untuk tujuan ini, mereka menggabungkan jaringan saraf inferensi bersama (JI-Nets) dengan jaringan memori jangka pendek (LSTM).

LSTM membantu mengaitkan tampilan yang disimpan dengan tampilan yang ada di bingkai saat ini sedangkan JI-Nets memungkinkan untuk membandingkan tampilan dua objek yang terdeteksi secara bersamaan dari awal—salah satu aspek paling unik dari pendekatan baru ini. Menggunakan penampilan historis dengan cara ini memungkinkan algoritme untuk mengatasi oklusi jangka pendek dari objek yang dilacak. “Dibandingkan dengan metode konvensional yang mengekstrak fitur dari setiap objek secara independen, metode inferensi bersama yang diusulkan menunjukkan akurasi yang lebih baik dalam tugas pengawasan publik, yaitu pelacakan pejalan kaki,” menyoroti Dr. Jeon. Selain itu, para peneliti juga mengimbangi kelemahan utama pembelajaran mendalam—kecepatan rendah—dengan mengadopsi paralelisasi GPU berbasis pengindeksan untuk mengurangi waktu komputasi. Pengujian pada kumpulan data pengawasan publik mengonfirmasi bahwa kerangka kerja pelacakan yang diusulkan menawarkan akurasi mutakhir dan oleh karena itu siap untuk diterapkan.

Pelacakan multi-objek membuka banyak aplikasi mulai dari mengemudi otonom hingga pengawasan publik, yang dapat membantu memerangi kejahatan dan mengurangi frekuensi kecelakaan. “Kami percaya metode kami dapat menginspirasi peneliti lain untuk mengembangkan pendekatan baru berbasis pembelajaran mendalam untuk akhirnya meningkatkan keselamatan publik,” simpul Dr. Jeon.


Pelacakan gerak 3-D yang akurat dan efisien menggunakan pembelajaran mendalam


Informasi lebih lanjut:
Young-Chul Yoon et al, Pelacakan beberapa pejalan kaki online menggunakan asosiasi pencocokan penampilan temporal yang dalam, Ilmu Informasi (2020). DOI: 10.1016 / j.ins.2020.10.002

Disediakan oleh GIST (Institut Sains dan Teknologi Gwangju)

Kutipan: Ilmuwan mengadopsi pembelajaran mendalam untuk pelacakan multi-objek (2021, 19 Juli) diambil 19 Juli 2021 dari https://techxplore.com/news/2021-07-scientists-deep-multi-object-tracking.html

Dokumen ini tunduk pada hak cipta. Terlepas dari transaksi wajar apa pun untuk tujuan studi atau penelitian pribadi, tidak ada bagian yang boleh direproduksi tanpa izin tertulis. Konten disediakan untuk tujuan informasi saja.


Halaman Ini Di Persembahkan Oleh : Result SGP