Arsitektur pembelajaran penguatan yang mendalam menggabungkan keterampilan yang telah dipelajari sebelumnya untuk menciptakan rangkaian keterampilan baru dengan cepat
Ai

Arsitektur pembelajaran penguatan yang mendalam menggabungkan keterampilan yang telah dipelajari sebelumnya untuk menciptakan rangkaian keterampilan baru dengan cepat


Menggunakan MELA, robot berkaki empat mempelajari perilaku adaptif. Kredit: Yang et al., Robot Sci. 5, eabb2174 (2020)

Sebuah tim peneliti dari Universitas Edinburgh dan Universitas Zhejiang telah mengembangkan cara untuk menggabungkan jaringan saraf dalam (DNN) untuk membuat jenis sistem baru dengan jenis kemampuan belajar baru. Grup tersebut menjelaskan arsitektur baru mereka dan performanya dalam jurnal Ilmu Robotika.

Jaringan neural dalam dapat mempelajari fungsi dengan melatih beberapa contoh secara berulang. Sampai saat ini, mereka telah digunakan dalam berbagai macam aplikasi seperti mengenali wajah di keramaian atau memutuskan apakah pemohon pinjaman layak mendapatkan kredit. Dalam upaya baru ini, para peneliti telah menggabungkan beberapa DNN yang dikembangkan untuk berbagai aplikasi untuk membuat sistem baru dengan manfaat dari semua DNN penyusunnya. Mereka melaporkan bahwa sistem yang dihasilkan lebih dari sekadar jumlah bagian-bagiannya — sistem ini mampu mempelajari fungsi baru yang tidak dapat dilakukan oleh DNN sendiri. Para peneliti menyebutnya sebagai arsitektur pembelajaran multi-pakar (MELA).

Lebih khusus lagi, pekerjaan tersebut melibatkan pelatihan beberapa DNN untuk fungsi yang berbeda. Seseorang belajar membuat robot berlari, misalnya; yang lain bisa melewati rintangan. Semua DNN kemudian dihubungkan ke jaringan neural gerbang yang belajar dari waktu ke waktu bagaimana memanggil DNN lain ketika sesuatu muncul yang memerlukan keahlian khusus saat ia mengendalikan robot yang bergerak di sekitar lingkungannya. Sistem yang dihasilkan tersebut kemudian dapat menjalankan semua keterampilan dari semua DNN gabungan.

Video bertutur yang membahas cara kerja MELA dan kebaruannya. Kredit: Yang et al., Robot Sci. 5, eabb2174 (2020)

Tetapi itu bukanlah akhir dari latihan ini — karena MELA belajar lebih banyak tentang bagian-bagian penyusunnya dan kemampuannya, ia belajar untuk menggunakannya bersama-sama melalui trial and error dengan cara yang belum pernah diajarkan. Ia belajar, misalnya, bagaimana menggabungkan bangun setelah jatuh dengan berurusan dengan lantai yang licin, atau apa yang harus dilakukan jika salah satu motornya rusak. Para peneliti menyarankan pekerjaan mereka menandai tonggak baru dalam penelitian robotika, memberikan paradigma baru di mana manusia tidak harus menengahi ketika robot menghadapi masalah yang belum pernah dialami sebelumnya.

Video eksperimen luar ruangan di mana robot yang diprogram MELA pulih dari tendangan ke tanah. Kredit: Yang et al., Robot Sci. 5, eabb2174 (2020)
Video tentang robot berkaki empat yang berlari di berbagai jenis permukaan, termasuk permukaan yang licin. Kredit: Yang et al., Robot Sci. 5, eabb2174 (2020)
Video robot yang diprogram MELA berlari di atas kerikil atau rumput di luar, entah dari mana, seorang manusia mendorongnya ke tanah. Robot pulih dengan cepat, berkat MELA. Kredit: Yang et al., Robot Sci. 5, eabb2174 (2020)
Video MELA menghadapi berbagai tantangan dalam simulasi. Kredit: Yang et al., Robot Sci. 5, eabb2174 (2020)
Video pemulihan jatuh yang kurang efisien menggunakan pengontrol default dari robot berkaki empat. Kredit: Yang et al., Robot Sci. 5, eabb2174 (2020)
Arsitektur pembelajaran penguatan yang mendalam menggabungkan keterampilan yang telah dipelajari sebelumnya untuk menciptakan rangkaian keterampilan baru dengan cepat

Menggunakan MELA, robot berkaki empat mempelajari keterampilan baru dari keterampilan yang telah dilatih sebelumnya. Kredit: Yang et al., Robot Sci. 5, eabb2174 (2020)


Peneliti menemukan cara untuk mengelabui jaringan saraf dalam menjadi gambar ‘mengenali’ yang tidak ada


Informasi lebih lanjut:
Chuanyu Yang dkk. Pembelajaran multi-ahli tentang penggerak kaki adaptif, Ilmu Robotika (2020). DOI: 10.1126 / scirobotics.abb2174

© 2020 Science X Network

Kutipan: Arsitektur pembelajaran penguatan mendalam menggabungkan keterampilan yang telah dipelajari sebelumnya untuk membuat rangkaian keterampilan baru dengan cepat (2020, 10 Desember), diakses 10 Desember 2020 dari https://techxplore.com/news/2020-12-deep-reinforcement-learning -arsitektur-menggabungkan-pra-pelajari.html

Dokumen ini memiliki hak cipta. Selain dari transaksi yang adil untuk tujuan studi atau penelitian pribadi, tidak ada bagian yang boleh direproduksi tanpa izin tertulis. Konten disediakan untuk tujuan informasi saja.


Halaman Ini Di Persembahkan Oleh : Toto SGP