Robot yang memutuskan langkah selanjutnya membutuhkan bantuan dalam memprioritaskan
Robot

Robot yang memutuskan langkah selanjutnya membutuhkan bantuan dalam memprioritaskan


Lingkungan permusuhan dan multi-agen di mana dua tim memainkan permainan Capture the Flag. Dinamika baru dapat ditambahkan ke lingkungan untuk menguji adaptasi. Kredit: Universitas Illinois di Urbana-Champaign

Saat robot menggantikan manusia dalam situasi berbahaya seperti misi pencarian dan penyelamatan, mereka harus dapat dengan cepat menilai dan membuat keputusan — untuk bereaksi dan beradaptasi seperti manusia. Para peneliti di University of Illinois di Urbana-Champaign menggunakan model yang didasarkan pada game Capture the Flag untuk mengembangkan pandangan baru tentang pembelajaran penguatan mendalam yang membantu robot mengevaluasi langkah selanjutnya.

Tim peneliti memilih Capture the Flag karena dimainkan dengan dua tim, masing-masing dengan beberapa rekan satu tim, di mana tim lawan juga mengambil keputusan.

“Robot dapat belajar bagaimana bereaksi dalam lingkungan seperti permainan kompetitif dengan menggunakan semacam proses coba-coba, yang disebut pembelajaran penguatan. Mereka mempelajari tindakan apa yang harus dilakukan dalam situasi tertentu dengan memainkan permainan,” kata Huy Tran, seorang peneliti. di Departemen Teknik Dirgantara UIUC. “Tantangannya adalah mencari cara untuk membuat agen yang juga dapat beradaptasi dengan situasi yang tidak terduga.”

Tran mengatakan timnya menyadari bahwa robot membutuhkan bantuan dalam memprioritaskan tugas.

“Mengingat keseluruhan tugas menangkap bendera, sebenarnya ada sub tugas yang harus diselesaikan di sepanjang jalan, yang kami modelkan dalam struktur hierarki. Apa yang ingin kami jelajahi adalah apakah jenis hierarki ini akan membantu kemampuan untuk beradaptasi atau tidak. . “

Dengan pembelajaran penguatan mendalam hierarkis, Tran mengatakan tugas dibagi — untuk menangkap bendera atau menandai anggota tim lawan untuk menghilangkannya — sehingga model dapat menangani masalah yang lebih kompleks.

“Dengan memecah tugas menjadi beberapa sub tugas, kami dapat meningkatkan adaptasi. Kami melatih pengambil keputusan tingkat tinggi yang menetapkan sub tugas untuk setiap agen untuk fokus.” Kata Tran. Struktur hierarki membantu dengan membuat pembaruan pada model lebih sederhana, kata Tran. Hanya pengontrol hierarkis yang perlu diperbarui daripada setiap agen.

“Pendekatan ini berpotensi untuk memecahkan masalah yang menarik dan menantang, tetapi ada banyak masalah yang masih perlu kami atasi sebelum kami dapat menerapkan sistem ini dalam situasi dunia nyata. Misalnya, kami mempelajari bahwa kerangka kerja ini dapat membantu adaptasi , “Kata Tran,” tetapi kami menyadari bahwa dalam studi ini kami memutuskan sub tugas apa yang harus didasarkan pada intuisi kami sendiri tentang cara kerja game. Itu tidak ideal karena memiliki bias kami sendiri. Apa yang kami lakukan sekarang adalah melihat teknik baru untuk memungkinkan agen mencari tahu apa sub-tujuan itu sendiri. “

Penelitian, “Mengevaluasi Kinerja Adaptasi dari Pembelajaran Penguatan Mendalam Hierarki,” ditulis oleh Neale Van Stralen, Seung Hyun Kim, Huy T. Tran, dan Girish Chowdhary. Penelitian ini didanai oleh Defense Advanced Research Projects Agency dan dipresentasikan pada IEEE International Conference on Robotics and Automation (ICRA) 2020 dan diterbitkan dalam prosiding konferensi. Video pendek mengilustrasikan pekerjaan yang menyertakan pengontrol hierarki dalam tindakan.


Peneliti memanfaatkan kelemahan bot master game


Informasi lebih lanjut:
Neale Van Stolen dkk. Mengevaluasi Kinerja Adaptasi Pembelajaran Penguatan Mendalam Hierarki, Konferensi Internasional IEEE 2020 tentang Robotika dan Otomasi (ICRA) (2020). DOI: 10.1109 / ICRA40945.2020.9197052

Disediakan oleh University of Illinois di Urbana-Champaign

Kutipan: Robot yang memutuskan langkah selanjutnya membutuhkan bantuan dalam memprioritaskan (2020, 21 Oktober) diambil 28 November 2020 dari https://techxplore.com/news/2020-10-robots-prioritizing.html

Dokumen ini memiliki hak cipta. Selain dari transaksi yang adil untuk tujuan studi atau penelitian pribadi, tidak ada bagian yang boleh direproduksi tanpa izin tertulis. Konten disediakan untuk tujuan informasi saja.


Halaman Ini Di Persembahkan Oleh : Singapore Prize