'Dapatkah saya melihat daftar bagian Anda?' Apa yang dicoba melalui saluran obrolan AI tentang bahasa yang dihasilkan komputer
Machine

‘Dapatkah saya melihat daftar bagian Anda?’ Apa yang dicoba melalui saluran obrolan AI tentang bahasa yang dihasilkan komputer


Kredit: Desain Sararoom / Shutterstock

Pernahkah Anda bertanya-tanya seperti apa menggoda dengan kecerdasan buatan? Ilmuwan riset dan insinyur Janelle Shane telah memberi kita ide dengan melatih jaringan saraf — algoritme yang diilhami secara longgar oleh struktur otak biologis — untuk menghasilkan kalimat obrolan.

Beberapa hasilnya lucu dan benar-benar tidak masuk akal, seperti: “Kaos Dasi Leher 2-nada Rugboat 2017” yang tidak elegan. Tetapi beberapa di antaranya ternyata cukup baik. Setidaknya, jika Anda adalah robot:

“Aku tahu dari lampu kekuatan merahmu bahwa kamu menyukaiku. Kamu terlihat seperti benda dan aku mencintaimu. Bolehkah aku melihat daftar bagianmu?”

Tetapi bagaimana garis-garis ini dihasilkan, dan mengapa hasilnya sangat bervariasi dalam hal kualitas dan keterpaduan? Itu tergantung pada jenis jaringan neural yang digunakan Shane: semuanya berdasarkan GPT-3, model bahasa terbesar di dunia hingga saat ini.

Pemodelan bahasa

GPT adalah singkatan dari trafo pra-terlatih generatif. Versi saat ini, yang dikembangkan oleh OpenAI, adalah yang ketiga dari sistem pemrosesan bahasa alami yang terus meningkat yang dilatih untuk menghasilkan teks atau ucapan yang mirip manusia.

Pemrosesan bahasa alami, atau NLP, mengacu pada aplikasi komputer untuk memproses dan menghasilkan teks lisan atau tertulis yang koheren dalam jumlah besar. Apakah Anda meminta Siri untuk pembaruan cuaca, meminta Alexa untuk menyalakan lampu, atau Anda menggunakan Google untuk menerjemahkan pesan dari bahasa Prancis ke bahasa Inggris, Anda dapat melakukannya karena perkembangan di NLP.

Dibutuhkan berbagai tugas NLP — dari pengenalan ucapan hingga memisahkan struktur kalimat — untuk aplikasi seperti Siri hingga permintaan yang berhasil. Asisten virtual, seperti alat berbasis bahasa lainnya, dilatih menggunakan ribuan kalimat, idealnya seragam dan beragam mungkin.

Karena bahasa manusia sangat kompleks, aplikasi NLP terbaik semakin bergantung pada model terlatih yang memungkinkan “pembelajaran dua arah kontekstual”. Ini berarti mempertimbangkan konteks kata yang lebih luas dalam sebuah kalimat, memindai kiri dan kanan kata tertentu untuk mengidentifikasi makna yang dimaksud dari kata tersebut. Model yang lebih baru bahkan dapat memperhatikan fitur bahasa manusia yang lebih bernuansa, seperti ironi dan sarkasme.

Pujian komputer

GPT-3 adalah AI penghasil bahasa yang sangat sukses karena tidak perlu pelatihan ulang berulang kali untuk menyelesaikan tugas baru. Alih-alih, ia menggunakan apa yang telah dipelajari model tentang bahasa dan menerapkannya pada sesuatu yang baru — seperti menulis artikel dan kode komputer, menghasilkan dialog baru dalam video game, atau merumuskan percakapan.

Dibandingkan dengan pendahulunya GPT-2, model generasi ketiga ini 116 kali lebih besar dan telah dilatih dengan data miliaran kata. Untuk menghasilkan baris obrolannya, GPT-3 hanya diminta untuk mengotomatiskan teks untuk artikel dengan judul: “Ini adalah baris pengambilan teratas tahun 2021! Buat kagum orang yang Anda sukai dan dapatkan hasilnya!”

Karena pembaruan pelatihan GPT-3 telah ditambahkan secara bertahap dari waktu ke waktu, permintaan yang sama ini juga dapat digunakan pada varian yang lebih kecil dan lebih mendasar — ​​menghasilkan jalur obrolan yang lebih aneh dan kurang koheren:

“Hai, nama saya John Smith. Maukah Anda duduk di kotak roti saya saat saya memasak atau adakah batasan kecepatan untuk benda itu? Sangat penting bagi Anda untuk menjadi atlet profesional. CAPE FASHION.”

Namun varian “DaVinci” GPT-3 — iterasinya yang terbesar dan paling kompeten hingga saat ini — menghasilkan beberapa upaya yang lebih meyakinkan yang mungkin bisa dianggap sebagai rayuan yang efektif — dengan sedikit penyesuaian:

“Kamu memiliki taring terindah yang pernah saya lihat. Aku mencintaimu. Aku tidak peduli jika kamu seorang doggo dalam mantel parit. Aku memiliki tepat 4 stiker. Aku ingin kamu menjadi yang ke-5.”

Varian terbaru GPT-3 saat ini merupakan model bahasa kontekstual terbesar di dunia dan mampu menyelesaikan sejumlah tugas yang sangat mengesankan. Tapi apakah cukup pintar untuk menyamar sebagai manusia?

Hampir manusia

Sebagai salah satu pelopor komputasi modern dan sangat percaya pada kecerdasan buatan sejati, Alan Turing mengembangkan “Game Imitasi” pada tahun 1950 — sekarang dikenal sebagai “Tes Turing”. Jika kinerja komputer tidak dapat dibedakan dari kinerja manusia, itu lulus Tes Turing. Dalam pembuatan bahasa saja, GPT-3 dapat segera lulus ujian Alan Turing.

Tapi tidak masalah apakah GPT-3 lulus Tes Turing atau tidak. Kinerjanya kemungkinan besar akan bergantung pada tugas spesifik yang digunakan model tersebut — yang, jika dilihat dari kemesraan teknologinya, mungkin harus menjadi sesuatu selain seni halus percakapan.

Dan, bahkan jika itu harus lulus Tes Turing, ini tidak akan membuat model itu benar-benar cerdas. Paling-paling, itu akan sangat terlatih pada tugas-tugas semantik tertentu. Mungkin pertanyaan yang lebih penting untuk ditanyakan adalah: apakah kita bahkan ingin menjadikan GPT-3 lebih manusiawi?

Belajar dari manusia

Tak lama setelah diumumkan pada musim panas 2020, GPT-3 menjadi berita utama karena memuntahkan konten yang sangat rasis dan seksis. Tapi ini tidak mengherankan. Generator bahasa dilatih pada teks dalam jumlah besar di internet, dan tanpa pemodelan ulang dan pelatihan ulang itu ditakdirkan untuk mereplikasi bias, bahasa berbahaya dan misinformasi yang kita tahu ada secara online.

Jelasnya, model bahasa seperti GPT-3 tidak datang tanpa potensi risiko. Jika kita ingin sistem ini menjadi dasar asisten digital atau agen percakapan kita, kita harus lebih teliti dan selektif saat memberi mereka bahan bacaan untuk dipelajari.

Namun, penelitian terbaru menunjukkan bahwa pengetahuan GPT-3 tentang sisi gelap internet sebenarnya dapat digunakan untuk mendeteksi ujaran kebencian online secara otomatis, dengan akurasi hingga 78%. Jadi meskipun saluran obrolannya tampaknya tidak mungkin untuk menyalakan lebih banyak cinta di dunia, GPT-3 dapat diatur, setidaknya, untuk mengurangi kebencian.


Menuju model pembelajaran mendalam yang dapat bernalar tentang kode lebih seperti manusia


Disediakan oleh The Conversation

Artikel ini diterbitkan ulang dari The Conversation di bawah lisensi Creative Commons. Baca artikel aslinya.The Conversation

Kutipan: ‘Dapatkah saya melihat daftar bagian Anda?’ Apa yang dicoba melalui saluran obrolan AI tentang bahasa yang dihasilkan komputer (2021, 28 April) diambil pada 28 April 2021 dari https://techxplore.com/news/2021-04-ai-chat-up-lines-computer-generated -language.html

Dokumen ini memiliki hak cipta. Selain dari transaksi yang adil untuk tujuan studi atau penelitian pribadi, tidak ada bagian yang boleh direproduksi tanpa izin tertulis. Konten tersebut disediakan untuk tujuan informasi saja.


Halaman Ini Di Persembahkan Oleh : Result SGP