Metode pelatihan anjing membantu mengajari robot untuk mempelajari trik baru
Robot

Metode pelatihan anjing membantu mengajari robot untuk mempelajari trik baru


“Pertanyaannya di sini adalah bagaimana kita membuat robot itu mempelajari suatu keterampilan?” kata penulis utama Andrew Hundt, seorang mahasiswa PhD yang bekerja di Laboratorium Interaksi Komputasi dan Robotika Johns Hopkins. Kredit: Will Kirk / Universitas Johns Hopkins

Dengan teknik pelatihan yang biasa digunakan untuk mengajari anjing duduk dan diam, ilmuwan komputer Universitas Johns Hopkins menunjukkan robot cara belajar sendiri beberapa trik baru, termasuk menyusun balok. Dengan metode tersebut, robot, bernama Spot, dapat belajar dalam beberapa hari yang biasanya membutuhkan waktu sebulan.

Dengan menggunakan penguatan positif, pendekatan yang akrab bagi siapa saja yang menggunakan camilan untuk mengubah perilaku anjing, tim secara dramatis meningkatkan keterampilan robot dan melakukannya dengan cukup cepat untuk membuat robot pelatihan untuk pekerjaan dunia nyata menjadi usaha yang lebih layak. Penemuan ini baru saja diterbitkan dalam sebuah makalah berjudul, “Robot yang Baik!”

“Pertanyaannya di sini adalah bagaimana kita membuat robot itu mempelajari suatu keterampilan?” kata penulis utama Andrew Hundt, Ph.D. siswa yang bekerja di Laboratorium Interaksi Komputasi dan Robotika Johns Hopkins. “Saya punya anjing, jadi saya tahu penghargaan berhasil dan itulah inspirasi bagaimana saya merancang algoritme pembelajaran.”

Tidak seperti manusia dan hewan yang lahir dengan otak yang sangat intuitif, komputer adalah papan tulis kosong dan harus mempelajari segalanya dari awal. Tetapi pembelajaran yang benar sering kali dicapai dengan trial and error, dan ahli robot masih mencari tahu bagaimana robot dapat belajar secara efisien dari kesalahan mereka.

Tim menyelesaikannya di sini dengan merancang sistem penghargaan yang bekerja untuk robot seperti memperlakukan bekerja untuk anjing. Di mana seekor anjing mungkin mendapatkan kue untuk pekerjaan yang dilakukan dengan baik, robot tersebut memperoleh poin numerik.

Hundt ingat bagaimana dia pernah mengajari anak anjing terrier mix miliknya bernama Leah perintah “tinggalkan saja”, sehingga dia bisa mengabaikan tupai saat berjalan-jalan. Dia menggunakan dua jenis suguhan, suguhan pelatih biasa dan sesuatu yang bahkan lebih baik, seperti keju. Ketika Leah bersemangat dan mengendus-endus camilan, dia tidak mendapat apa-apa. Tetapi ketika dia tenang dan membuang muka, dia mendapatkan barang bagus. “Saat itulah aku memberinya keju dan berkata, ‘Biarkan! Leah yang baik!'”

Demikian pula, untuk menumpuk blok, Spot robot perlu belajar bagaimana fokus pada tindakan konstruktif. Saat robot menjelajahi blok, ia dengan cepat mengetahui bahwa perilaku yang benar untuk menumpuk menghasilkan poin tinggi, tetapi yang salah tidak menghasilkan apa-apa. Menjangkau tetapi tidak memahami blok? Tidak ada poin. Menjatuhkan tumpukan? Jelas tidak ada poin. Spot memperoleh penghasilan paling banyak dengan menempatkan blok terakhir di atas tumpukan empat blok.

Taktik pelatihan tidak hanya berhasil, hanya perlu beberapa hari untuk mengajari robot apa yang biasanya membutuhkan waktu berminggu-minggu. Tim mampu mengurangi waktu latihan dengan terlebih dahulu melatih robot simulasi, yang sangat mirip dengan video game, kemudian menjalankan tes dengan Spot.

“Robot menginginkan skor yang lebih tinggi,” kata Hundt. “Robot dengan cepat mempelajari perilaku yang benar untuk mendapatkan hadiah terbaik. Faktanya, robot ini biasanya membutuhkan waktu latihan selama sebulan untuk mencapai akurasi 100%. Kami dapat melakukannya dalam dua hari.”

Penguatan positif tidak hanya bekerja untuk membantu robot belajar sendiri untuk menumpuk balok, dengan sistem poin robot dengan cepat mempelajari beberapa tugas lain — bahkan cara memainkan permainan navigasi simulasi. Kemampuan untuk belajar dari kesalahan dalam semua jenis situasi sangat penting untuk merancang robot yang dapat beradaptasi dengan lingkungan baru.

“Pada awalnya robot tidak tahu apa yang dilakukannya tetapi akan menjadi lebih baik dan lebih baik dengan setiap latihan. Ia tidak pernah menyerah dan terus mencoba menumpuk dan mampu menyelesaikan tugas 100% setiap saat,” kata Hundt.

Tim membayangkan temuan ini dapat membantu melatih robot rumah tangga untuk mencuci dan mencuci piring — tugas yang bisa populer di pasar terbuka dan membantu lansia hidup mandiri. Ini juga dapat membantu merancang mobil self-driving yang ditingkatkan.

“Tujuan kami pada akhirnya adalah mengembangkan robot yang dapat melakukan tugas kompleks di dunia nyata — seperti perakitan produk, merawat orang tua, dan operasi,” kata Hager. “Saat ini kami tidak tahu bagaimana memprogram tugas-tugas seperti itu — dunia ini terlalu rumit. Tetapi pekerjaan seperti ini menunjukkan kepada kami bahwa ada janji untuk gagasan bahwa robot dapat belajar bagaimana menyelesaikan tugas-tugas dunia nyata dengan cara yang aman dan efisien. cara.”


Boston Dynamics akan memberi Spot lengan robot dan stasiun pengisian daya


Informasi lebih lanjut:
Andrew Hundt dkk, “Robot yang Baik!”: Pembelajaran Penguatan yang Efisien untuk Tugas Visual Multi-Langkah dengan Sim ke Transfer Nyata, IEEE Robotics and Automation Letters (2020). DOI: 10.1109 / LRA.2020.3015448

Disediakan oleh Universitas Johns Hopkins

Kutipan: Metode pelatihan anjing membantu mengajarkan robot untuk mempelajari trik baru (2020, 26 Oktober), diakses 27 November 2020 dari https://techxplore.com/news/2020-10-dog-methods-robots.html

Dokumen ini memiliki hak cipta. Selain dari transaksi yang adil untuk tujuan studi atau penelitian pribadi, tidak ada bagian yang boleh direproduksi tanpa izin tertulis. Konten disediakan untuk tujuan informasi saja.


Halaman Ini Di Persembahkan Oleh : Singapore Prize