Ai

Pembelajaran mesin menjamin kinerja robot di wilayah yang tidak diketahui


Pembelajaran mesin menjamin kinerja robot di wilayah yang tidak diketahui

Peneliti Princeton menguji pendekatan pembelajaran mesin baru untuk menjamin keamanan dan kesuksesan robot dalam pengaturan yang tidak biasa. Eksperimen termasuk memprogram drone kecil yang disebut Parrot Swing untuk menghindari rintangan saat terbang menyusuri koridor sepanjang 60 kaki. Kredit: Video oleh Intelligent Robot Motion Lab; GIF oleh Josh Cartagena

Sebuah drone kecil melakukan uji terbang melalui ruang yang diisi dengan silinder karton yang ditempatkan secara acak yang bertindak sebagai pelindung pohon, orang, atau bangunan. Algoritme yang mengendalikan drone telah dilatih pada seribu simulasi kursus sarat rintangan, tetapi tidak pernah terlihat seperti ini. Namun, sembilan kali dari 10, pesawat berukuran pint itu menghindari semua rintangan di jalurnya.

Eksperimen ini adalah tempat pembuktian untuk tantangan penting dalam robotika modern: kemampuan untuk menjamin keamanan dan keberhasilan robot otomatis yang beroperasi di lingkungan baru. Ketika para insinyur semakin beralih ke metode pembelajaran mesin untuk mengembangkan robot yang dapat beradaptasi, pekerjaan baru oleh para peneliti Universitas Princeton membuat kemajuan pada jaminan semacam itu untuk robot dalam konteks dengan beragam jenis hambatan dan kendala.

“Selama sekitar satu dekade terakhir, ada banyak kegembiraan dan kemajuan seputar pembelajaran mesin dalam konteks robotika, terutama karena memungkinkan Anda menangani input sensorik yang kaya,” seperti yang berasal dari kamera robot, dan memetakan input kompleks ini untuk tindakan, kata Anirudha Majumdar, asisten profesor teknik mesin dan dirgantara di Princeton.

Namun, algoritme kontrol robot yang didasarkan pada pembelajaran mesin berisiko mengalami overfitting pada data pelatihannya, yang dapat membuat algoritme menjadi kurang efektif saat menemukan input yang berbeda dari yang dilatihkan. Lab Robot Gerak Cerdas Majumdar menjawab tantangan ini dengan memperluas rangkaian alat yang tersedia untuk melatih kebijakan kontrol robot, dan mengukur kemungkinan keberhasilan dan keamanan robot yang bekerja di lingkungan baru.

Dalam tiga makalah baru, para peneliti mengadaptasi kerangka pembelajaran mesin dari arena lain ke bidang penggerak dan manipulasi robot. Mereka beralih ke teori generalisasi, yang biasanya digunakan dalam konteks yang memetakan input tunggal ke output tunggal, seperti pemberian tag gambar otomatis. Metode baru ini termasuk yang pertama menerapkan teori generalisasi ke tugas yang lebih kompleks dalam membuat jaminan atas kinerja robot dalam pengaturan yang tidak biasa. Sementara pendekatan lain telah memberikan jaminan seperti itu dengan asumsi yang lebih ketat, metode tim menawarkan jaminan yang dapat diterapkan secara lebih luas pada kinerja di lingkungan baru, kata Majumdar.

Peneliti Princeton mengadaptasi kerangka kerja pembelajaran mesin dari arena lain ke bidang penggerak dan manipulasi robot, menerapkan teori generalisasi untuk tugas kompleks dalam membuat jaminan pada kinerja robot dalam pengaturan yang tidak biasa. Sebagai bukti prinsip, para peneliti memvalidasi teknik tersebut dengan menilai penghindaran rintangan dari drone kecil yang disebut Parrot Swing saat terbang menyusuri koridor sepanjang 60 kaki yang dihiasi silinder karton. Tingkat keberhasilan yang dijamin dari kebijakan kendali drone adalah 88,4%, dan itu menghindari rintangan dalam 18 dari 20 percobaan (90%). Kredit: Lab Robot Gerak Cerdas di Universitas Princeton

Pada makalah pertama, bukti prinsip penerapan framework machine learning, tim menguji pendekatan mereka dalam simulasi yang mencakup kendaraan beroda yang melewati ruang yang penuh dengan rintangan, dan lengan robotik yang menggenggam objek di atas meja. Mereka juga memvalidasi teknik dengan menilai penghindaran rintangan dari drone kecil yang disebut Parrot Swing (kombinasi quadcopter dan pesawat sayap tetap) saat terbang menyusuri koridor sepanjang 60 kaki yang dihiasi dengan silinder karton. Tingkat keberhasilan yang dijamin dari kebijakan kendali drone adalah 88,4%, dan itu menghindari rintangan dalam 18 dari 20 percobaan (90%).

Karya, diterbitkan 3 Oktober di Jurnal Internasional Penelitian Robotika, Disusun bersama oleh Majumdar; Alec Farid, seorang mahasiswa pascasarjana di bidang teknik mesin dan ruang angkasa; dan Anoopkumar Sonar, konsentrator ilmu komputer dari Princeton’s Class of 2021.

Saat menerapkan teknik pembelajaran mesin dari area lain ke robotika, kata Farid, “ada banyak asumsi khusus yang perlu Anda penuhi, dan salah satunya adalah mengatakan seberapa mirip lingkungan yang Anda harapkan untuk dilihat dengan lingkungan kebijakan Anda. dilatih. Selain menunjukkan bahwa kami dapat melakukan ini dalam pengaturan robotik, kami juga berfokus pada upaya memperluas jenis lingkungan yang dapat kami jamin. “

“Jenis jaminan yang dapat kami berikan berkisar dari sekitar 80% hingga 95% tingkat keberhasilan pada lingkungan baru, bergantung pada tugas tertentu, tetapi jika Anda menerapkan [an unmanned aerial vehicle] di lingkungan nyata, 95% mungkin tidak cukup baik, “kata Majumdar.” Saya melihatnya sebagai salah satu tantangan terbesar, dan yang sedang kami garap secara aktif. “

Namun, pendekatan tim mewakili kemajuan yang sangat dibutuhkan dalam jaminan generalisasi untuk robot yang beroperasi di lingkungan yang tidak terlihat, kata Hongkai Dai, ilmuwan peneliti senior di Toyota Research Institute di Los Altos, California.

Peneliti Princeton menggunakan pembelajaran imitasi untuk meningkatkan keberhasilan kebijakan kontrol robot berbasis pembelajaran mesin. Eksperimen simulasi termasuk (1) lengan robotik yang bertugas menggenggam dan mengangkat mug minum dengan berbagai ukuran, bentuk dan bahan; (2) lengan mendorong kotak ke seberang meja; dan (3) robot beroda yang menavigasi furnitur di lingkungan seperti rumah. Para peneliti menerapkan kebijakan yang dipelajari dari tugas menggenggam mug dan mendorong kotak pada lengan robotik di laboratorium, yang mampu mengambil 25 mug berbeda dengan memegang pinggirannya di antara dua gripper yang seperti jari. Kredit: Lab Robot Gerak Cerdas di Universitas Princeton

“Jaminan ini sangat penting untuk banyak aplikasi keselamatan kritis, seperti mobil tanpa pengemudi dan drone otonom, di mana set pelatihan tidak dapat mencakup setiap skenario yang mungkin,” kata Dai, yang tidak terlibat dalam penelitian tersebut. “Jaminan tersebut memberi tahu kami seberapa besar kemungkinan sebuah kebijakan masih dapat bekerja dengan baik pada kasus-kasus yang tidak terlihat, dan karenanya membangun kepercayaan pada kebijakan tersebut, di mana taruhan kegagalannya terlalu tinggi.”

Dalam dua makalah lainnya, yang akan dipresentasikan pada 18 November di Konferensi Virtual tentang Pembelajaran Robot, para peneliti memeriksa perbaikan tambahan untuk membawa kebijakan kendali robot lebih dekat ke jaminan yang akan dibutuhkan untuk penyebaran dunia nyata. Satu makalah menggunakan pembelajaran imitasi, di mana seorang “ahli” manusia memberikan data pelatihan dengan secara manual memandu robot simulasi untuk mengambil berbagai objek atau bergerak melalui ruang yang berbeda dengan rintangan. Pendekatan ini dapat meningkatkan keberhasilan kebijakan kontrol berbasis pembelajaran mesin.

Untuk memberikan data pelatihan, penulis utama Allen Ren, seorang mahasiswa pascasarjana di bidang teknik mesin dan kedirgantaraan, menggunakan mouse komputer 3-D untuk mengontrol lengan robot yang disimulasikan dengan tugas memegang dan mengangkat mug minum dengan berbagai ukuran, bentuk, dan bahan. Eksperimen pembelajaran imitasi lainnya melibatkan lengan yang mendorong kotak ke seberang meja, dan simulasi robot beroda yang menavigasi furnitur di lingkungan seperti rumah.

Para peneliti menerapkan kebijakan yang dipelajari dari tugas menggenggam mug dan mendorong kotak pada lengan robotik di laboratorium, yang mampu mengambil 25 mug berbeda dengan memegang pinggirannya di antara dua gripper yang seperti jari — bukan memegang gagangnya seperti manusia akan. Dalam contoh mendorong kotak, kebijakan mencapai 93% keberhasilan pada tugas yang lebih mudah dan 80% pada tugas yang lebih sulit.

“Kami memiliki kamera di atas meja yang melihat lingkungan dan mengambil gambar lima kali per detik,” kata Ren. “Simulasi pelatihan kebijakan kami mengambil gambar ini dan mengeluarkan jenis tindakan apa yang harus diambil robot, dan kemudian kami memiliki pengontrol yang menggerakkan lengan ke lokasi yang diinginkan berdasarkan keluaran model.”

Peneliti Princeton mendemonstrasikan pengembangan perencana berbasis visi yang memberikan jaminan bagi robot terbang atau berjalan untuk melakukan urutan gerakan yang direncanakan melalui lingkungan yang beragam. Mereka mengevaluasi perencana berbasis visi pada simulasi drone yang menavigasi di sekitar rintangan dan robot berkaki empat yang melintasi medan kasar dengan kemiringan setinggi 35 derajat. Kredit: Lab Robot Gerak Cerdas di Universitas Princeton

Makalah ketiga mendemonstrasikan pengembangan perencana berbasis visi yang memberikan jaminan bagi robot terbang atau berjalan untuk melakukan urutan gerakan yang direncanakan melalui lingkungan yang beragam. Menghasilkan kebijakan kontrol untuk gerakan yang direncanakan membawa masalah skala baru — kebutuhan untuk mengoptimalkan kebijakan berbasis visi dengan ribuan, bukan ratusan, dimensi.

“Itu membutuhkan beberapa alat algoritmik baru untuk dapat menangani dimensi itu dan masih dapat memberikan jaminan generalisasi yang kuat,” kata penulis utama Sushant Veer, rekan penelitian pascadoktoral di bidang teknik mesin dan ruang angkasa.

Aspek kunci dari strategi Veer adalah penggunaan gerakan primitif, di mana kebijakan mengarahkan robot untuk berjalan lurus atau berbelok, misalnya, daripada menentukan torsi atau kecepatan untuk setiap gerakan. Mempersempit ruang dari kemungkinan tindakan membuat proses perencanaan lebih mudah dikerjakan secara komputasi, kata Majumdar.

Veer dan Majumdar mengevaluasi perencana berbasis visi pada simulasi drone yang menavigasi di sekitar rintangan dan robot berkaki empat yang melintasi medan kasar dengan kemiringan setinggi 35 derajat— “masalah yang sangat menantang yang masih dicoba oleh banyak orang di bidang robotika menyelesaikannya, “kata Veer.

Dalam penelitian tersebut, robot berkaki mencapai tingkat keberhasilan 80% di lingkungan pengujian yang tidak terlihat. Para peneliti sedang bekerja untuk lebih meningkatkan jaminan kebijakan mereka, serta menilai kinerja kebijakan pada robot nyata di laboratorium.


Sistem untuk meningkatkan navigasi dalam ruangan robot


Informasi lebih lanjut:
Anirudha Majumdar et al, PAC-Bayes control: kebijakan pembelajaran yang terbukti menggeneralisasi lingkungan baru, Jurnal Internasional Penelitian Robotika (2020). DOI: 10.1177 / 0278364920959444

Disediakan oleh Universitas Princeton

Kutipan: Pembelajaran mesin menjamin kinerja robot di wilayah yang tidak diketahui (2020, 17 November), diakses 27 November 2020 dari https://techxplore.com/news/2020-11-machine-robots-unknown-territory.html

Dokumen ini memiliki hak cipta. Selain dari transaksi yang adil untuk tujuan studi atau penelitian pribadi, tidak ada bagian yang boleh direproduksi tanpa izin tertulis. Konten disediakan untuk tujuan informasi saja.


Halaman Ini Di Persembahkan Oleh : Toto SGP