Alat pengubah teks ini menunjukkan caranya
Computer

Alat pengubah teks ini menunjukkan caranya


Kredit: Shutterstock

Sebagian besar dari kita mendapat manfaat setiap hari dari fakta bahwa komputer sekarang dapat “memahami” kita saat kita berbicara atau menulis. Namun hanya sedikit dari kita yang berhenti sejenak untuk mempertimbangkan cara yang berpotensi merusak dari teknologi yang sama ini dalam membentuk budaya kita.

Bahasa manusia penuh dengan ambiguitas dan makna ganda. Misalnya, pertimbangkan arti potensial dari frasa ini: “Saya pergi ke kelas proyek.” Tanpa konteks, itu adalah pernyataan yang ambigu.

Ilmuwan dan ahli bahasa komputer telah menghabiskan beberapa dekade mencoba memprogram komputer untuk memahami nuansa bahasa manusia. Dan dengan cara tertentu, komputer dengan cepat mendekati kemampuan manusia untuk memahami dan menghasilkan teks.

Melalui tindakan menyarankan beberapa kata dan bukan yang lain, teks prediktif dan fitur pelengkapan otomatis di perangkat kita mengubah cara kita berpikir. Melalui interaksi sehari-hari yang halus ini, pembelajaran mesin memengaruhi budaya kita. Apakah kita siap untuk itu?

Saya membuat karya interaktif online untuk Kyogle Writers Festival yang memungkinkan Anda menjelajahi teknologi ini dengan cara yang tidak berbahaya.

Apa itu pemrosesan bahasa alami?

Bidang yang berkaitan dengan penggunaan bahasa sehari-hari untuk berinteraksi dengan komputer disebut “pemrosesan bahasa alami.” Kami menemukannya ketika kami berbicara dengan Siri atau Alexa, atau mengetik kata-kata ke dalam browser dan sisa kalimat kami diprediksi.

Ini hanya mungkin karena peningkatan besar dalam pemrosesan bahasa alami selama dekade terakhir—dicapai melalui algoritme pembelajaran mesin canggih yang dilatih pada kumpulan data yang sangat besar (biasanya miliaran kata).

Tahun lalu, potensi teknologi ini menjadi jelas ketika Generative Pre-trained Transformer 3 (GPT-3) dirilis. Ini menetapkan tolok ukur baru dalam apa yang dapat dilakukan komputer dengan bahasa.

GPT-3 dapat mengambil hanya beberapa kata atau frasa dan menghasilkan seluruh dokumen bahasa yang “bermakna”, dengan menangkap hubungan kontekstual antara kata-kata dalam sebuah kalimat. Ini dilakukan dengan membangun model pembelajaran mesin, termasuk dua model yang diadopsi secara luas yang disebut “BERT” dan “ELMO”.

Bagaimana teknologi ini mempengaruhi budaya?

Namun, ada masalah utama dengan model bahasa apa pun yang dihasilkan oleh pembelajaran mesin: mereka umumnya mempelajari semua yang mereka ketahui dari sumber data seperti Wikipedia dan Twitter.

Akibatnya, pembelajaran mesin mengambil data dari masa lalu, “belajar” darinya untuk menghasilkan model, dan menggunakan model ini untuk melakukan tugas di masa depan. Tetapi selama proses ini, sebuah model dapat menyerap pandangan dunia yang terdistorsi atau bermasalah dari data pelatihannya.

Jika data pelatihan bias, bias ini akan dikodifikasi dan diperkuat dalam model, bukan ditantang. Misalnya, seorang model mungkin akhirnya mengasosiasikan kelompok atau ras identitas tertentu dengan kata-kata positif, dan yang lain dengan kata-kata negatif.

Hal ini dapat menyebabkan pengucilan dan ketidaksetaraan yang serius, seperti yang dijelaskan dalam film dokumenter Coded Bias baru-baru ini.

Semua yang pernah Anda katakan

Karya interaktif yang saya buat memungkinkan orang untuk bermain-main mendapatkan intuisi tentang bagaimana komputer memahami bahasa. Ini disebut Everything You Ever Said (EYES), mengacu pada cara model bahasa alami menggunakan semua jenis sumber data untuk pelatihan.

EYES memungkinkan Anda untuk mengambil tulisan apa pun (kurang dari 2000 karakter) dan “mengurangi” satu konsep dan “menambahkan” yang lain. Dengan kata lain, ini memungkinkan Anda menggunakan komputer untuk mengubah arti sebuah teks. Anda bisa mencobanya sendiri.

Berikut adalah contoh lagu kebangsaan Australia yang mengalami beberapa revisi otomatis. Saya mengurangi konsep “kekaisaran” dan menambahkan konsep “koala” untuk mendapatkan:

“Semua orang Australia biarkan kami berduka
Karena kita adalah satu dan bebas
Kami memiliki biota emas dan kelimpahan untuk kemiskinan
Koala kami dipasangkan oleh porpoise
Satwa liar kita berlimpah di koala primata
Kealamian tidak bergeser dan langka
Di wombat primata, biarkan setiap koala
Pameran koala wombat
Dalam aspergillosis yang menggembirakan maka mari kita bersuara,
Pameran koala wombat “

Apa yang terjadi disini? Pada intinya, EYES menggunakan model bahasa Inggris yang dikembangkan oleh peneliti dari Stanford University di Amerika Serikat, yang disebut GLoVe (Global Vectors for Word Representation).

EYES menggunakan GLoVe untuk mengubah teks dengan membuat serangkaian analogi, di mana “analogi” adalah perbandingan antara satu hal dengan hal lainnya. Misalnya, jika saya bertanya kepada Anda: “pria adalah raja untuk apa wanita?”—Anda mungkin menjawab “ratu.” Itu mudah.

Tapi saya bisa mengajukan pertanyaan yang lebih menantang seperti: “mawar adalah duri untuk apa cinta?” Ada beberapa kemungkinan jawaban di sini, tergantung pada interpretasi bahasa Anda. Ketika ditanya tentang analogi ini, GLoVe akan menghasilkan jawaban “ratu” dan “pengkhianatan”.

GLoVe memiliki setiap kata dalam bahasa Inggris yang direpresentasikan sebagai vektor dalam ruang multi-dimensi (sekitar 300 dimensi). Dengan demikian, ia dapat melakukan perhitungan dengan kata-kata, menambah dan mengurangi kata-kata seolah-olah itu angka.

Budaya Cyborg sudah ada di sini

Masalah dengan pembelajaran mesin adalah bahwa asosiasi yang dibuat antara konsep tertentu tetap tersembunyi di dalam kotak hitam; kita tidak bisa melihat atau menyentuhnya. Pendekatan untuk membuat model pembelajaran mesin lebih transparan adalah fokus dari banyak penelitian saat ini.

Tujuan EYES adalah memungkinkan Anda bereksperimen dengan asosiasi ini dengan cara yang lebih menyenangkan, sehingga Anda dapat mengembangkan intuisi tentang cara model pembelajaran mesin memandang dunia.

Beberapa analogi akan mengejutkan Anda dengan kepedihan mereka, sementara yang lain mungkin membuat Anda bingung. Namun, setiap asosiasi disimpulkan dari kumpulan besar beberapa miliar kata yang ditulis oleh orang biasa.

Model seperti GPT-3, yang telah belajar dari sumber data serupa, sudah memengaruhi cara kami menggunakan bahasa. Memiliki seluruh umpan berita yang diisi oleh teks yang ditulis mesin bukan lagi fiksi ilmiah. Teknologi ini sudah ada di sini.

Dan jejak budaya model pembelajaran mesin tampaknya hanya akan berkembang.


Jaringan saraf tiruan untuk memperoleh representasi dasar dari tindakan dan bahasa robot


Disediakan oleh The Conversation

Artikel ini diterbitkan ulang dari The Conversation di bawah lisensi Creative Commons. Baca artikel aslinya.Percakapan

Kutipan: Pembelajaran mesin mengubah budaya: Alat pengubah teks ini menunjukkan bagaimana (2021, 1 Juni) diambil pada 1 Juni 2021 dari https://techxplore.com/news/2021-06-machine-culture-text-altering-tool.html

Dokumen ini tunduk pada hak cipta. Terlepas dari transaksi wajar apa pun untuk tujuan studi atau penelitian pribadi, tidak ada bagian yang boleh direproduksi tanpa izin tertulis. Konten disediakan untuk tujuan informasi saja.




Halaman Ini Di Persembahkan Oleh : Pengeluaran HK