Peneliti Angkatan Darat mengembangkan kerangka kerja inovatif untuk melatih AI
Spotlight

Peneliti Angkatan Darat mengembangkan kerangka kerja inovatif untuk melatih AI


Sebuah ilustrasi menunjukkan beberapa metode pembelajaran menggunakan pendekatan aktor-kritik. (Kiri) Pembelajar mandiri dengan hadiah bersama, (Tengah) Pembelajar mandiri dengan berbagi informasi dan hadiah bersama, (Kanan) Pelajar bersama dengan hadiah mandiri. Kredit: Angkatan Darat AS

Peneliti Angkatan Darat telah mengembangkan kerangka kerja perintis yang menyediakan dasar untuk pengembangan sistem multi-agen kolaboratif.

Kerangka kerja ini dirinci dalam makalah survei “Survei algoritme pembelajaran penguatan multi-agen terbaru yang menggunakan pelatihan terpusat,” yang ditampilkan di Perpustakaan Digital SPIE. Para peneliti mengatakan pekerjaan itu akan mendukung penelitian dalam pendekatan pembelajaran penguatan untuk mengembangkan sistem multi-agen kolaboratif seperti tim robot yang dapat bekerja berdampingan dengan tentara masa depan.

“Kami mengusulkan bahwa mekanisme berbagi informasi yang mendasari memainkan peran penting dalam pembelajaran terpusat untuk sistem multi-agen, tetapi ada studi terbatas tentang fenomena ini dalam komunitas penelitian,” kata peneliti Angkatan Darat dan ilmuwan komputer Dr. Piyush K. Sharma dari Komando Pengembangan Kemampuan Tempur Angkatan Darat AS, yang dikenal sebagai DEVCOM, Laboratorium Penelitian Angkatan Darat. “Kami melakukan survei mutakhir dalam algoritma pembelajaran penguatan dan paradigma berbagi informasi mereka sebagai dasar untuk mengajukan pertanyaan mendasar tentang pembelajaran terpusat untuk sistem multi-agen yang akan meningkatkan kemampuan mereka untuk bekerja sama.”

Kolaborator Sharma dalam proyek ini termasuk peneliti DEVCOM ARL Drs. Erin Zaroukian, Rolando Fernandez, Michael Dorothy, Derrik Asher dan Anjon Basak, seorang rekan postdoctoral di bawah program beasiswa Oak Ridge Associated Universities.

Survei state-of-the-art dalam pembelajaran penguatan ini menetapkan dasar bagi para peneliti yang ingin mengembangkan sistem multi-agen otonom melalui mekanisme berbagi informasi yang ditingkatkan, misalnya fungsi penghargaan atau observasi dan berbagi ruang negara.

Melatih banyak agen secara bersamaan lebih sulit karena sifat dinamis dari lingkungan kompleks yang dapat mengalami kutukan dimensi; semakin banyak agen, semakin rumit koordinasinya, kata Sharma. Makalah ini mengembangkan kerangka kerja untuk mengkarakterisasi parameter berbagi informasi utama yang sering membingungkan dan tidak mudah dipahami.

Para peneliti memperkirakan bahwa sentralisasi dalam pelatihan dapat menjadi solusi menuju pengembangan sistem otonom yang lebih cepat yang dapat secara fleksibel bekerja bersama tentara di masa depan.

“Pelatihan terpusat yang konsisten dapat menghasilkan sistem multi-agen yang bekerja bersama lebih andal, meningkatkan tingkat kepercayaan dari prajurit kecerdasan buatan,” kata Sharma. “Secara khusus, kami fokus pada mengidentifikasi dan mengkarakterisasi kerangka matematika yang mendasari algoritma pembelajaran terpusat terbaru.”

Peneliti Angkatan Darat mengembangkan kerangka kerja inovatif untuk melatih AI

Peneliti Angkatan Darat mengembangkan kerangka kerja perintis yang menyediakan dasar untuk pengembangan sistem multi-agen kolaboratif. Kredit: Spc. Adeline Witherspoon

Model matematika semacam itu dapat memberikan jalan untuk mengeksplorasi teknik pembelajaran terpusat alternatif untuk mengukur efeknya pada tingkat pembelajaran dan perilaku kolaboratif yang muncul, katanya.

Survei ini melebihi literatur penelitian sebelumnya dalam dua cara:

  • Menciptakan tampilan terkonsolidasi dari state-of-the-art terbaru dalam algoritma pembelajaran penguatan
  • Menguraikan pendekatan baru untuk menggambarkan informasi yang dibagikan selama pembelajaran terpusat

Para peneliti berfokus pada algoritme yang diterbitkan dalam waktu lima hingga enam tahun. Karena algoritma ini sangat baru, mereka belum dieksplorasi secara ekstensif oleh komunitas riset. Pada saat publikasi, mereka tidak menemukan pekerjaan sebelumnya yang komprehensif.

Para peneliti berusaha untuk mendefinisikan dan mengkategorikan mekanisme untuk berbagi, berorientasi pada apa yang sebenarnya dibagikan dan bukan bagaimana dibagikan. Mereka optimis bahwa mereka telah mengidentifikasi kesenjangan dalam teknik pembelajaran penguatan baru-baru ini yang layak untuk studi lebih lanjut yang berpotensi meningkatkan proses pelatihan agen.

Para peneliti mengatakan mereka optimis survei akan menghasilkan diskusi dan eksplorasi lebih lanjut dari ruang masalah pembelajaran mesin untuk melatih sistem multi-agen otonom.

“Karena permintaan untuk sistem multi-agen yang bekerja secara kooperatif telah menjadi lebih umum di industri komersial, misalnya, robot gudang Amazon, pertunjukan drone Intel di Olimpiade musim dingin 2018. Ada juga kebutuhan yang muncul untuk teknologi sistem multi-agen ini untuk membantu Angkatan Darat dalam operasi taktis kolaboratif,” kata Sharma. “Penelitian yang dihasilkan dari dokumen survei ini dapat membuat tujuan AI yang andal dan kolaboratif dapat dicapai.”

Ke depan, tim merasa lebih siap untuk menyelidiki aspek-aspek tertentu dari pendekatan berbasis pembelajaran penguatan multi-agen yang melatih agen secara terpusat.

Teknik terpusat datang dengan keterbatasan tertentu, sehingga mereka juga akan melakukan analisis empiris terhadap teknik pembelajaran terdesentralisasi yang ada, kata Sharma. Mereka berencana untuk bergerak menuju pemodelan dan simulasi pelatihan pembelajaran penguatan multi-agen untuk memvalidasi dan memperluas teori pembelajaran agen, perilaku dan koordinasi.


Penelitian tentara mengarah pada model pelatihan robot yang lebih efektif


Informasi lebih lanjut:
Piyush K. Sharma et al, Survei algoritme pembelajaran penguatan multi-agen baru-baru ini menggunakan pelatihan terpusat, Kecerdasan Buatan dan Pembelajaran Mesin untuk Aplikasi Operasi Multi-Domain III (2021). DOI: 10.1117/12.2585808

Disediakan oleh The Army Research Laboratory

Kutipan: Peneliti Angkatan Darat mengembangkan kerangka kerja inovatif untuk pelatihan AI (2021, 7 Juni) diambil 7 Juni 2021 dari https://techxplore.com/news/2021-06-army-framework-ai.html

Dokumen ini tunduk pada hak cipta. Terlepas dari transaksi wajar apa pun untuk tujuan studi atau penelitian pribadi, tidak ada bagian yang boleh direproduksi tanpa izin tertulis. Konten disediakan untuk tujuan informasi saja.


Halaman Ini Di Persembahkan Oleh : Pengeluaran SGP Hari Ini