MuZero DeepMind menaklukkan dan mempelajari aturan seperti yang dilakukannya
Machine

MuZero DeepMind menaklukkan dan mempelajari aturan seperti yang dilakukannya


Kredit: Domain Publik Unsplash / CC0

Albert Einstein pernah berkata, “Anda harus mempelajari aturan permainan, dan kemudian Anda harus bermain lebih baik dari orang lain.” Itu bisa jadi moto di DeepMind, karena sebuah laporan baru mengungkapkan bahwa mereka telah mengembangkan program yang dapat menguasai game yang kompleks bahkan tanpa mengetahui aturannya.

DeepMind, anak perusahaan Alphabet, sebelumnya telah membuat langkah terobosan menggunakan pembelajaran penguatan untuk mengajarkan program untuk menguasai permainan papan Tiongkok Go dan permainan strategi Jepang Shogi, serta permainan catur dan video game Atari yang menantang. Dalam semua kasus tersebut, komputer diberi aturan permainan.

Tapi Alam melaporkan hari ini bahwa MuZero milik DeepMind telah mencapai prestasi yang sama — dan dalam beberapa kasus, mengalahkan program sebelumnya — tanpa mempelajari aturannya terlebih dahulu.

Pemrogram di DeepMind mengandalkan prinsip yang disebut “pencarian melihat ke depan”. Dengan pendekatan itu, MuZero menilai sejumlah gerakan potensial berdasarkan bagaimana lawan akan merespons. Meskipun kemungkinan akan ada sejumlah gerakan potensial yang mengejutkan dalam permainan kompleks seperti catur, MuZero memprioritaskan manuver yang paling relevan dan paling mungkin, belajar dari langkah sukses dan menghindari yang gagal.

Saat tampil melawan Nyonya Pac-Man Atari, MuZero dibatasi untuk mempertimbangkan hanya enam atau tujuh gerakan potensial di masa depan, namun tetap tampil mengagumkan, menurut para peneliti.

“Untuk pertama kalinya, kami benar-benar memiliki sistem yang mampu membangun pemahamannya sendiri tentang bagaimana dunia bekerja dan menggunakan pemahaman tersebut untuk melakukan perencanaan ke depan yang canggih seperti yang Anda lihat sebelumnya untuk game seperti catur,” kata ilmuwan penelitian utama DeepMind, David Silver. MuZero dapat “memulai dari nol, dan hanya melalui coba-coba, keduanya menemukan aturan dunia dan menggunakan aturan tersebut untuk mencapai kinerja manusia super.”

Silver membayangkan aplikasi yang lebih besar untuk MuZero daripada sekadar game. Kemajuan telah dibuat pada kompresi video, tugas yang menantang mengingat banyaknya jumlah format video yang bervariasi dan banyak mode kompresi. Sejauh ini, mereka telah mencapai peningkatan kompresi 5%, bukan prestasi kecil bagi perusahaan milik Google, yang juga menangani cache video raksasa di situs web terpopuler kedua di dunia, YouTube, di mana satu miliar jam konten berada. dilihat setiap hari. (Situs web No. 1? Google.)

Silver mengatakan laboratorium tersebut juga mempelajari pemrograman robotika dan desain arsitektur protein, yang menjanjikan produksi obat yang dipersonalisasi.

Ini adalah “langkah maju yang signifikan”, menurut Wendy Hall, profesor ilmu komputer di Universitas Southampton dan anggota dewan AI Inggris. “Hasil kerja DeepMind cukup mencengangkan dan saya kagum pada apa yang akan mereka capai di masa depan dengan sumber daya yang mereka miliki,” katanya.

Namun dia juga menyuarakan keprihatinan tentang potensi pelecehan. “Kekhawatiran saya adalah bahwa sementara terus berusaha untuk meningkatkan kinerja algoritme mereka dan menerapkan hasil untuk kepentingan masyarakat, tim di DeepMind tidak berusaha keras untuk memikirkan kemungkinan konsekuensi yang tidak diinginkan dari pekerjaan mereka,” katanya.

Faktanya, Angkatan Udara AS telah memanfaatkan makalah penelitian awal yang mencakup MuZero yang dipublikasikan tahun lalu dan menggunakan informasi tersebut untuk merancang sistem AI yang dapat meluncurkan rudal dari pesawat mata-mata U-2 terhadap target tertentu.

Saat ditanya oleh Berkabel apa yang dia pikirkan tentang aplikasi militer semacam itu, Silver tidak meninggalkan keraguan tentang kekhawatirannya.

“Saya menentang penggunaan AI dalam senjata mematikan apa pun, dan saya berharap kami membuat lebih banyak kemajuan menuju larangan senjata otonom yang mematikan,” katanya. Dia menambahkan bahwa DeepMind dan para pendirinya semuanya telah menandatangani Janji Senjata Otonomi Lethal, yang menegaskan keyakinan bahwa teknologi mematikan harus selalu berada di bawah kendali manusia, dan bukan algoritma berbasis AI.

Silver mengatakan tantangan ke depan adalah memahami dan menerapkan algoritme seefektif dan sekuat otak manusia. “Kita harus bertujuan untuk mencapai itu. Langkah pertama dalam melakukan perjalanan itu adalah mencoba memahami apa artinya mencapai kecerdasan,” katanya. “Kami pikir ini sangat penting untuk memperkaya apa yang sebenarnya bisa dilakukan AI karena dunia adalah tempat yang berantakan. Itu tidak diketahui — tidak ada yang memberi kami buku peraturan yang luar biasa ini yang mengatakan,” Oh, begitulah cara dunia bekerja, “kata Silver. “Jika kita ingin AI kita pergi keluar ke dunia dan dapat merencanakan dan melihat ke depan dalam masalah di mana tidak ada yang memberi kita buku peraturan, kita benar-benar membutuhkan ini.”


Alphabet’s DeepMind menguasai game Atari


Informasi lebih lanjut:
Julian Schrittwieser dkk. Menguasai Atari, Go, catur dan shogi dengan perencanaan dengan model yang dipelajari, Alam (2020). DOI: 10.1038 / s41586-020-03051-4

© 2020 Science X Network

Kutipan: MuZero DeepMind menaklukkan dan mempelajari aturan sebagaimana mestinya (2020, 24 Desember) diambil pada 24 Desember 2020 dari https://techxplore.com/news/2020-12-deepmind-muzero-conquers.html

Dokumen ini memiliki hak cipta. Selain dari transaksi yang adil untuk tujuan studi atau penelitian pribadi, tidak ada bagian yang boleh direproduksi tanpa izin tertulis. Konten disediakan untuk tujuan informasi saja.


Halaman Ini Di Persembahkan Oleh : Result SGP