Mengajar agen AI untuk berkomunikasi dan bertindak di dunia fantasi
Sciences

Mengajar agen AI untuk berkomunikasi dan bertindak di dunia fantasi


Kredit: Pixabay / CC0 Domain Publik

Dalam beberapa tahun terakhir, alat kecerdasan buatan (AI), termasuk teknik pemrosesan bahasa alami (NLP), telah menjadi semakin canggih, mencapai hasil luar biasa dalam berbagai tugas. Teknik NLP dirancang khusus untuk memahami bahasa manusia dan menghasilkan respons yang sesuai, sehingga memungkinkan komunikasi antara manusia dan agen buatan.

Studi lain juga memperkenalkan agen berorientasi tujuan yang dapat secara mandiri menavigasi lingkungan virtual atau videogame. Sejauh ini, teknik NLP dan agen berorientasi tujuan biasanya dikembangkan secara individual, daripada digabungkan menjadi metode terpadu.

Para peneliti di Georgia Institute of Technology dan Facebook AI Research baru-baru ini mengeksplorasi kemungkinan melengkapi agen yang digerakkan oleh tujuan dengan kemampuan NLP sehingga mereka dapat berbicara dengan karakter lain dan menyelesaikan tindakan yang diinginkan dalam lingkungan game fantasi. Makalah mereka, yang telah diterbitkan sebelumnya di arXiv, menunjukkan bahwa jika digabungkan, kedua pendekatan ini mencapai hasil yang luar biasa, menghasilkan karakter permainan yang berbicara dan bertindak dengan cara yang sesuai dengan motivasi mereka secara keseluruhan.

“Agen yang berkomunikasi dengan manusia dan agen lain dalam mengejar suatu tujuan masih cukup primitif,” Prithviraj Ammanabrolu, salah satu peneliti yang melakukan penelitian tersebut, mengatakan kepada TechXplore. “Kami beroperasi berdasarkan hipotesis bahwa ini karena sebagian besar tugas NLP dan kumpulan data saat ini bersifat statis dan dengan demikian mengabaikan sejumlah besar literatur yang menyarankan bahwa interaktivitas dan landasan bahasa diperlukan untuk pembelajaran bahasa yang efektif.”

Mengajar agen AI untuk berkomunikasi dan bertindak di dunia fantasi

Arsitektur jaringan saraf dikembangkan oleh para peneliti. Kredit: Ammanabrolu et al.

Salah satu cara utama melatih agen AI adalah meminta mereka melatih keterampilan mereka dalam lingkungan simulasi interaktif. Permainan naratif interaktif, juga dikenal sebagai petualangan teks, dapat sangat berguna untuk melatih agen percakapan dan yang digerakkan oleh tujuan, karena memungkinkan berbagai macam interaksi verbal dan terkait tindakan.

“Permainan naratif interaktif adalah simulasi di mana seorang agen berinteraksi dengan dunia murni melalui bahasa alami —- ‘memahami’, ‘bertindak atas’ dan ‘berbicara dengan’ dunia menggunakan deskripsi, perintah, dan dialog tekstual,” kata Ammanabrolu. “Sebagai bagian dari upaya ini, tim ParlAI di FAIR menciptakan LIGHT, sebuah game petualangan teks fantasi berskala besar yang berskala besar tempat Anda dapat bertindak dan berbicara sebagai karakter di dunia ini. Ini adalah platform tempat kami melakukan eksperimen.”

LIGHT, platform yang digunakan para peneliti untuk melatih agen percakapan yang digerakkan oleh tujuan mereka, menawarkan sejumlah besar dunia fantasi yang berisi beragam karakter, lokasi, dan objek. Meskipun demikian, platform itu sendiri tidak menetapkan tujuan atau sasaran tertentu untuk setiap karakter yang menavigasi lingkungan ini.

Mengajar agen AI untuk berkomunikasi dan bertindak di dunia fantasi

Contoh data yang digunakan untuk melatih agen AI. Kredit: Ammanabrolu et al.

Sebelum mereka mulai melatih agen mereka, oleh karena itu, Ammanabrolu dan rekan-rekannya menyusun kumpulan data pencarian yang dapat ditugaskan ke karakter dalam game, yang mereka sebut sebagai LIGHT-Quests. Quest ini dikumpulkan melalui crowdsourcing dan masing-masing menawarkan motivasi jangka pendek, menengah, dan panjang untuk karakter tertentu di LIGHT. Selanjutnya, tim meminta orang-orang untuk memainkan permainan dan mengumpulkan demonstrasi tentang bagaimana mereka bermain (yaitu, bagaimana karakter mereka bertindak, berbicara, dan menavigasi dunia fantasi) ketika mereka mencoba untuk memenuhi pencarian ini.

“Misalnya, bayangkan Anda seekor naga,” kata Ammanabrolu. “Dalam platform ini, motivasi jangka pendek Anda mungkin untuk memulihkan telur emas Anda yang dicuri dan menghukum ksatria yang melakukannya, tetapi motivasi jangka panjang yang mendasarinya adalah membangun diri Anda sendiri sebagai penimbunan harta karun terbesar yang ada.”

Selain membuat kumpulan data LIGHT-Quests dan mengumpulkan demonstrasi tentang bagaimana manusia akan memainkan permainan, Ammanabrolu dan rekan-rekannya memodifikasi ATOMIC, grafik pengetahuan akal sehat yang ada (yaitu, atlas fakta akal sehat yang dapat digunakan untuk melatih mesin), agar sesuai dunia fantasi di CAHAYA. Atlas baru tentang fakta akal sehat terkait LIGHT yang dibuat oleh para peneliti dikompilasi ke dalam kumpulan data lain, yang disebut ATOMIC-LIGHT.

Mengajar agen AI untuk berkomunikasi dan bertindak di dunia fantasi

Tangkapan layar dari antarmuka LIGHT. Kredit: Ammanabrolu et al.

Selanjutnya, para peneliti mengembangkan sistem berbasis pembelajaran mesin dan melatihnya pada dua dataset yang mereka buat (LIGHT-Quests dan ATOMIC-LIGHT) menggunakan metode yang dikenal sebagai pembelajaran penguatan. Melalui pelatihan ini, mereka pada dasarnya mengajarkan sistem untuk melakukan tindakan di LIGHT yang konsisten dengan motivasi karakter virtual yang mereka wujudkan, serta untuk mengatakan hal-hal kepada karakter lain yang mungkin membantu mereka menyelesaikan misi karakter mereka.

“Bagian dari jaringan saraf yang menjalankan agen AI telah dilatih sebelumnya tentang ATOMIC-LIGHT, serta LIGHT asli dan kumpulan data lain seperti Reddit, untuk memberikan gambaran umum tentang cara bertindak dan berbicara di dunia fantasi,” Ammanabrolu kata. “Masukan, deskripsi dunia, dan dialog dari karakter lain dikirim melalui jaringan saraf terlatih ke sakelar.”

Saat jaringan neural terlatih mengirimkan data masukan ke sakelar ini, sakelar memutuskan apakah agen harus melakukan tindakan atau mengatakan sesuatu ke karakter lain. Berdasarkan apa yang diputuskan, ia mengarahkan jaringan ke salah satu dari dua jaringan kebijakan, yang dirancang untuk menentukan tindakan spesifik atau kalimat apa yang harus diucapkan oleh karakter.

Ammanabrolu dan rekan-rekannya juga menempatkan agen AI terlatih lainnya yang dapat bertindak dan berbicara dalam lingkungan pelatihan LIGHT. Agen kedua ini berfungsi sebagai partner karakter utama saat mencoba menyelesaikan pencariannya.

Semua tindakan yang diselesaikan oleh kedua agen tersebut diproses oleh mesin permainan, yang juga memeriksa untuk melihat seberapa jauh kemajuan agen dalam menyelesaikan pencarian mereka. Selain itu, semua dialog yang dilakukan oleh karakter ditinjau oleh dungeon master (DM) yang menilai mereka berdasarkan seberapa ‘natural’ pidato yang mereka hasilkan dan seberapa cocok itu untuk dunia fantasi. DM pada dasarnya adalah model pembelajaran mesin lain yang dilatih tentang demonstrasi permainan manusia.

Mengajar agen AI untuk berkomunikasi dan bertindak di dunia fantasi

Kredit: Ammanabrolu et al.

“Sebagian besar tren yang Anda lihat saat melatih AI menggunakan kumpulan data statis yang umum di NLP saat ini tidak berlaku di lingkungan interaktif,” kata Ammanabrolu. “Wawasan utama dari pengujian studi ablasi kami untuk generalisasi zero-shot pada pencarian baru adalah bahwa pra-pelatihan berskala besar dalam pengaturan interaktif memerlukan pemilihan tugas pra-pelatihan secara cermat —- menyeimbangkan antara memberikan prior domain terbuka ‘umum’ kepada agen dan yang lebih ‘spesifik’ untuk tugas hilir —- sedangkan metodologi statis hanya memerlukan pra-pelatihan khusus domain untuk transfer yang efektif tetapi pada akhirnya kurang efektif daripada metode interaktif. “

Para peneliti melakukan serangkaian evaluasi awal dan menemukan bahwa agen AI mereka dapat bertindak dan berbicara dengan cara yang konsisten dengan motivasi karakter mereka dalam lingkungan game LIGHT. Secara keseluruhan, temuan mereka menunjukkan bahwa melatih jaringan saraf secara interaktif pada data terkait lingkungan dapat mengarah pada agen AI yang dapat bertindak dan berkomunikasi dengan cara yang ‘alami’ dan selaras dengan motivasi mereka.

Pekerjaan Ammanabrolu dan rekan-rekannya menimbulkan beberapa pertanyaan menarik mengenai potensi jaringan saraf pra-pelatihan dan menggabungkan NLP dengan RL. Pendekatan yang mereka kembangkan pada akhirnya dapat membuka jalan menuju penciptaan agen yang digerakkan oleh tujuan yang berkinerja tinggi dengan keterampilan komunikasi yang canggih.

“RL adalah cara yang sangat alami untuk membingkai masalah yang berorientasi pada tujuan tetapi secara historis ada badan kerja yang relatif kecil yang mencoba mencampurnya dengan kemajuan NLP seperti transformator seperti BERT atau GPT,” kata Ammanabrolu. “Itu akan menjadi lini pekerjaan berikutnya yang secara pribadi akan saya minati, untuk melihat bagaimana menggabungkan hal-hal ini dengan lebih baik sehingga lebih efektif memberi agen AI pendahuluan akal sehat yang lebih baik untuk bertindak dan berbicara di dunia interaktif ini.”


Peneliti memanfaatkan kelemahan bot master game


Informasi lebih lanjut:
Ammanabrolu et al., Cara memotivasi naga Anda: mengajar agen yang digerakkan oleh tujuan untuk berbicara dan bertindak di dunia fantasi. arXiv: 2010.00685 [cs.CL]. arxiv.org/abs/2010.00685

© 2020 Science X Network

Kutipan: Mengajar agen AI untuk berkomunikasi dan bertindak di dunia fantasi (2020, 4 November) diakses 27 November 2020 dari https://techxplore.com/news/2020-11-ai-agents-fantasy-worlds.html

Dokumen ini memiliki hak cipta. Selain dari transaksi yang adil untuk tujuan studi atau penelitian pribadi, tidak ada bagian yang boleh direproduksi tanpa izin tertulis. Konten disediakan untuk tujuan informasi saja.


Halaman Ini Di Persembahkan Oleh : Hongkong Prize