Cara melatih robot (menggunakan AI dan superkomputer)
Machine

Cara melatih robot (menggunakan AI dan superkomputer)


Contoh awan titik 3D yang disintesis oleh jaringan adversarial generatif bersyarat progresif (PCGAN) untuk bermacam-macam kelas objek. PCGAN menghasilkan geometri dan warna untuk awan titik, tanpa pengawasan, melalui proses pelatihan kasar hingga halus. Kredit: William Beksi, Mohammad Samiul Arshad, UT Arlington

Sebelum bergabung dengan Universitas Texas di Arlington sebagai Asisten Profesor di Departemen Ilmu dan Teknik Komputer dan mendirikan Laboratorium Visi Robot di sana, William Beksi magang di iRobot, produsen robot konsumen terbesar di dunia (terutama melalui ruang hampa robotik Roomba) .

Untuk menavigasi lingkungan yang dibangun, robot harus dapat merasakan dan membuat keputusan tentang bagaimana berinteraksi dengan lokalnya. Peneliti di perusahaan tertarik menggunakan mesin dan pembelajaran mendalam untuk melatih robot mereka mempelajari objek, tetapi hal itu membutuhkan kumpulan data gambar yang besar. Meskipun ada jutaan foto dan video ruangan, tidak ada yang diambil dari sudut pandang robot vakum. Upaya untuk melatih menggunakan gambar dengan perspektif human-centric gagal.

Riset Beksi berfokus pada robotika, computer vision, dan sistem cyber-fisik. “Secara khusus, saya tertarik untuk mengembangkan algoritme yang memungkinkan mesin belajar dari interaksi mereka dengan dunia fisik dan secara mandiri memperoleh keterampilan yang diperlukan untuk menjalankan tugas tingkat tinggi,” katanya.

Bertahun-tahun kemudian, sekarang dengan kelompok penelitian termasuk enam orang Ph.D. Mahasiswa ilmu komputer, Beksi mengenang masalah pelatihan Roomba dan mulai mencari solusinya. Pendekatan manual, yang digunakan oleh sebagian orang, melibatkan penggunaan kamera 360 derajat yang mahal untuk menangkap lingkungan (termasuk rumah sewaan Airbnb) dan perangkat lunak khusus untuk menjahit gambar kembali menjadi satu kesatuan. Tapi Beksi yakin metode pengambilan manual akan terlalu lambat untuk berhasil.

Alih-alih, ia mencari bentuk pembelajaran mendalam yang dikenal sebagai jaringan adversarial generatif, atau GAN, di mana dua jaringan saraf saling bersaing dalam sebuah permainan sampai ‘generator’ data baru dapat mengelabui ‘diskriminator’. Setelah dilatih, jaringan seperti itu akan memungkinkan terciptanya ruang atau lingkungan luar ruangan dalam jumlah tak terbatas, dengan berbagai jenis kursi atau meja atau kendaraan dengan bentuk yang sedikit berbeda, tetapi tetap — bagi seseorang dan robot — objek yang dapat diidentifikasi dengan dimensi yang dapat dikenali dan karakteristik.

“Anda dapat mengganggu objek-objek ini, memindahkannya ke posisi baru, menggunakan pencahayaan, warna, dan tekstur yang berbeda, lalu mengubahnya menjadi gambar pelatihan yang dapat digunakan dalam dataset,” jelasnya. “Pendekatan ini berpotensi memberikan data tak terbatas untuk melatih robot.”

“Mendesain objek-objek ini secara manual akan memakan banyak sekali sumber daya dan jam kerja manusia sementara, jika dilatih dengan benar, jaringan generatif dapat membuatnya dalam hitungan detik,” kata Mohammad Samiul Arshad, mahasiswa pascasarjana di kelompok Beksi yang terlibat dalam penelitian tersebut.

Menghasilkan objek untuk pemandangan sintetis

Setelah beberapa kali percobaan awal, Beksi menyadari mimpinya untuk menciptakan full scene yang fotorealistik saat ini di luar jangkauan. “Kami mundur selangkah dan melihat penelitian saat ini untuk menentukan bagaimana memulai pada skala yang lebih kecil — menghasilkan objek sederhana di lingkungan.”

Beksi dan Arshad mempresentasikan PCGAN, jaringan permusuhan generatif bersyarat pertama yang menghasilkan awan titik berwarna padat dalam mode tanpa pengawasan, pada Konferensi Internasional tentang Visi 3-D (3DV) pada November 2020. Makalah mereka, “A Progressive Conditional Generative Adversarial Network for Generating Dense and Colored 3-D Point Clouds, “menunjukkan bahwa jaringan mereka mampu belajar dari set pelatihan (berasal dari ShapeNetCore, database model CAD) dan meniru distribusi data 3-D untuk menghasilkan point cloud berwarna dengan detail halus di berbagai resolusi.

“Ada beberapa pekerjaan yang bisa menghasilkan objek sintetik dari dataset model CAD ini,” ujarnya. “Tapi belum ada yang bisa menangani warna.”

Cara melatih robot (menggunakan AI dan superkomputer)

Contoh awan titik 3D yang disintesis oleh jaringan adversarial generatif bersyarat progresif (PCGAN). Kredit: William Beksi, Mohammad Samiul Arshad, UT Arlington

Untuk menguji metodenya pada keragaman bentuk, tim Beksi memilih kursi, meja, sofa, pesawat terbang, dan sepeda motor untuk eksperimen mereka. Alat ini memungkinkan para peneliti untuk mengakses kemungkinan versi yang hampir tak terbatas dari kumpulan objek yang dihasilkan oleh sistem pembelajaran mendalam.

“Model kami pertama-tama mempelajari struktur dasar suatu objek pada resolusi rendah dan secara bertahap membangun ke arah detail tingkat tinggi,” jelasnya. Hubungan antara bagian-bagian objek dan warnanya — misalnya, kaki kursi / meja memiliki warna yang sama sedangkan kursi / atasannya kontras — juga dipelajari oleh jaringan. Kami memulai dari yang kecil, mengerjakan objek, dan membangun hierarki untuk melakukan pembuatan adegan sintetis penuh yang akan sangat berguna untuk robotika. “

Mereka menghasilkan 5.000 sampel acak untuk setiap kelas dan melakukan evaluasi menggunakan sejumlah metode berbeda. Mereka mengevaluasi geometri dan warna awan titik menggunakan berbagai metrik umum di lapangan. Hasilnya menunjukkan bahwa PCGAN mampu mensintesis point cloud berkualitas tinggi untuk berbagai kelas objek.

SIM2REAL

Persoalan lain yang sedang digarap Beksi dikenal dengan bahasa sehari-hari sebagai ‘sim2real’. “Anda memiliki data pelatihan nyata, dan data pelatihan sintetis, dan mungkin ada perbedaan kecil dalam cara sistem AI atau robot belajar darinya,” katanya. “‘Sim2real’ melihat bagaimana mengukur perbedaan tersebut dan membuat simulasi lebih realistis dengan menangkap fisika dari pemandangan itu — gesekan, tabrakan, gravitasi — dan dengan menggunakan penelusuran sinar atau foton.”

Langkah selanjutnya bagi tim Beksi adalah menerapkan perangkat lunak pada robot, dan melihat cara kerjanya dalam hubungannya dengan celah domain sim-ke-nyata.

Pelatihan model PCGAN dimungkinkan oleh sumber pembelajaran mendalam TACC Maverick 2, yang dapat diakses oleh Beksi dan mahasiswanya melalui program University of Texas Cyberinfrastructure Research (UTRC), yang menyediakan sumber daya komputasi untuk peneliti di salah satu UT System’s. 14 institusi.

“Jika Anda ingin meningkatkan resolusi untuk memasukkan lebih banyak poin dan lebih detail, peningkatan itu disertai dengan peningkatan biaya komputasi,” katanya. “Kami tidak memiliki sumber daya perangkat keras tersebut di lab saya, jadi penting untuk menggunakan TACC untuk melakukan itu.”

Selain kebutuhan komputasi, Beksi membutuhkan storage yang luas untuk penelitian. “Dataset ini sangat besar, terutama titik cloud 3-D,” ujarnya. “Kami menghasilkan ratusan megabyte data per detik; setiap titik cloud memiliki sekitar 1 juta poin. Anda membutuhkan penyimpanan yang sangat besar untuk itu.”

Meski Beksi mengatakan bahwa bidangnya masih jauh dari memiliki robot yang sangat kuat dan kuat yang dapat mandiri untuk jangka waktu yang lama, hal itu akan menguntungkan banyak domain, termasuk perawatan kesehatan, manufaktur, dan pertanian.

“Publikasi ini hanyalah satu langkah kecil menuju tujuan akhir menghasilkan adegan sintetis lingkungan dalam ruangan untuk memajukan kemampuan persepsi robotik,” katanya.


Peneliti menggunakan pembelajaran mesin untuk mengembangkan alat diagnostik COVID-19 yang lebih akurat


Informasi lebih lanjut:
Konferensi Internasional tentang Visi 3D (3DV), November 2020, “Jaringan Adversarial Generatif Bersyarat Progresif untuk Menghasilkan Awan Titik 3D Padat dan Berwarna”. arxiv.org/pdf/2010.05391.pdf

Disediakan oleh University of Texas di Austin

Kutipan: Cara melatih robot (menggunakan AI dan superkomputer) (2021, 20 Januari) diakses 24 Januari 2021 dari https://techxplore.com/news/2021-01-robot-ai-supercomputers.html

Dokumen ini memiliki hak cipta. Selain dari transaksi yang adil untuk tujuan studi atau penelitian pribadi, tidak ada bagian yang boleh direproduksi tanpa izin tertulis. Konten disediakan untuk tujuan informasi saja.


Halaman Ini Di Persembahkan Oleh : Result SGP