Memperluas cakrawala media sosial Anda
Internet

Memperluas cakrawala media sosial Anda


Evangelos Papalexakis adalah asisten profesor ilmu komputer dan teknik di Fakultas Teknik Marlan dan Rosemary Bourns UC Riverside. Penelitiannya mencakup ilmu data, pemrosesan sinyal, pembelajaran mesin, dan kecerdasan buatan. Salah satu proyeknya yang sedang berlangsung bertujuan untuk mengembangkan mekanisme deteksi berita palsu otomatis untuk media sosial.

Kebanyakan orang sekarang tahu bahwa apa yang mereka lihat di situs media sosial seperti Facebook ada hubungannya dengan algoritma misterius. Bisakah Anda menjelaskan apa itu algoritma, secara umum?

Anda dapat melihat algoritme sebagai sekumpulan instruksi yang harus diikuti komputer untuk memecahkan masalah, seperti resep di mana inputnya adalah bahan dan outputnya adalah makanan. Algoritma ini memiliki masukan, bisa berupa data, dan keluaran, yang bisa menjadi solusi dari suatu masalah.

Istilah lain yang sering kami lihat adalah pembelajaran mesin. Bisakah Anda menjelaskan apa itu?

Tom Mitchell dalam buku teks klasiknya mendefinisikan pembelajaran mesin sebagai studi tentang algoritma yang meningkatkan kinerja mereka pada tugas tertentu melalui pengalaman. Pengalaman biasanya mengacu pada data dalam kasus itu.

Seringkali, kami menyebut model pembelajaran mesin sebagai produk dari algoritma “pelatihan” pembelajaran mesin yang tugasnya adalah mempelajari cara menyelesaikan tugas tertentu yang ditugaskan padanya dengan datanya, dan kemudian menyaring pengetahuan itu dalam sebuah model, yang dapat sesederhana seperangkat aturan IF-THEN-ELSE, hingga sesuatu yang serumit jaringan neural.

Setelah pelatihan, kami menerapkan model pembelajaran mesin dan kemudian mengikuti algoritme lain, biasanya disebut algoritme “inferensi” atau “prediksi” atau “rekomendasi” yang, menggunakan model yang ada dan diberikan pengguna tertentu, mengeluarkan konten, terkadang dalam daftar peringkat, yang kemungkinan besar akan melibatkan pengguna.

Bagaimana perusahaan media sosial menggunakan model pembelajaran mesin untuk memfilter apa yang muncul di feed kami?

Dalam kasus khusus ini, tugasnya adalah mencari tahu apa yang akan ditampilkan kepada pengguna. Pengalaman adalah semua interaksi / keterlibatan / pembuatan konten pengguna di platform, dan kinerja dapat diukur dengan apakah pengguna berhasil menikmati dan / atau terlibat dengan rekomendasi — item yang ditampilkan di umpan — atau tidak.

Netflix memelopori hal ini dengan memulai kompetisi yang memikirkan tugas tepat ini dan memerlukan hadiah uang. Dalam solusi yang memenangkan persaingan, dan pada dasarnya setiap algoritme pembelajaran mesin rekomendasi, semuanya bermuara pada komputasi “representasi” pengguna dan “representasi” konten, lalu mencari tahu jenis konten apa, seperti film , pengguna tertentu kemungkinan besar akan menyukainya.

Secara sederhana, bayangkan representasi pengguna sebagai spreadsheet Excel yang barisnya adalah pengguna dan kolomnya adalah genre film yang berbeda dan setiap sel memberi tahu kita seberapa banyak pengguna ini “lebih memilih” genre khusus ini. Jika kita menggunakan representasi serupa untuk film, maka pada dasarnya kita dapat melihat pengguna mana yang memiliki kecocokan tinggi dengan film mana, dalam representasi “genre” tersebut. Kuncinya sekarang adalah mengidentifikasi “genre” tersebut dari banyaknya data di platform. Genre yang diberikan oleh studio film tidak selalu mencerminkan konteks orang yang menontonnya, tetapi muncul dari pola interaksi pengguna dan mengonsumsi konten. Demikian pula, platform media sosial menggunakan data yang dibuat dan dibagikan oleh pengguna dan semua jenis interaksi yang dilakukan pengguna dengan pembuat konten lain atau dengan konten untuk menetapkan “genre” mereka sendiri.

Data adalah pengubah permainan. Semua penelitian dalam pembelajaran mesin terbuka dan dibagikan kepada publik dengan kecepatan yang sangat tinggi, baik dari akademisi maupun industri. Yang membuat perbedaan adalah data yang digunakan untuk “melatih” model pembelajaran mesin. Siapa pun di dunia dapat bereksperimen dan mengutak-atik model paling mutakhir yang digunakan, tetapi tanpa data yang sama untuk melatihnya, dan data itulah yang membuat perbedaan. Dalam kasus media sosial, perilaku online kita adalah datanya.

Bagaimana model Facebook mengarahkan orang ke grup, halaman, dan individu yang memiliki minat yang sama, menciptakan ruang gema?

Secara umum, “suka” berarti keterlibatan positif. Oleh karena itu, ini menjadi sinyal yang dimasukkan ke dalam pelatihan model dan digunakan untuk memperbarui dan menyempurnakan representasi pengguna, yang berarti, kumpulan preferensi yang telah dipelajari algoritme untuk pengguna khusus ini.

Model pembelajaran mesin bertujuan untuk menentukan hal terbaik berikutnya yang kemungkinan besar akan melibatkan pengguna, misalnya, “suka” atau “beri peringkat 5 bintang”.

Kami tidak dapat mengukur secara tepat efek dari setiap jenis keterlibatan, karena ini sangat bergantung pada model tertentu dan bagaimana model itu dilatih. Misalnya, apakah “menyukai” sama dengan “membagikan” postingan? Apakah memberi peringkat dua bintang merupakan sinyal yang lebih kuat daripada menonton 10-15 menit pertama sebuah film dan kemudian berhenti? Namun secara umum, masuk akal untuk mengharapkan bahwa semakin kita terlibat dengan jenis konten tertentu, seperti film komedi atau gambar anjing, semakin kita memberi isyarat kepada model bahwa inilah yang kita suka.

Mengingat bahwa model dilatih dengan ini sebagai tujuan utama, model akan menyukai konten yang menyerupai konten yang telah digunakan oleh pengguna, dan ini berarti bahwa, di lautan luas konten yang dibagikan dalam suatu platform, kemungkinan besar akan diberi peringkat konten lainnya lebih rendah.

Apa yang dapat dilakukan orang-orang untuk memengaruhi model pembelajaran mesin Facebook agar menampilkan konten yang lebih beragam, baik itu gambar makan malam dari teman atau berita nasional?

Tidak jelas bagaimana hal itu bisa disistematisasi, karena tidak ada cara untuk mengetahui secara pasti seberapa besar setiap keterlibatan memengaruhi model dan seberapa besar hal itu bergantung pada jenis konten, seperti berita terbaru vs. gambar hewan peliharaan. Hal ini menunjukkan perlunya transparansi model yang dapat memberikan ringkasan yang dapat dibaca manusia tentang apa yang menurut model menjadi preferensi kita dan mungkin kemampuan untuk mengubahnya. Platform terkadang melakukan yang terakhir dengan menanyakan secara langsung apakah konten ini relevan saat ini, yang jelas tidak dapat mereka lakukan sepanjang waktu, jika tidak, pengguna akan merasa kesal. Namun cara yang baik untuk bersikap transparan sekarang menjadi arah yang sangat penting dalam komunitas riset. Anda mungkin pernah melihat Netflix, misalnya, terkadang mengatakan bahwa, “Karena Anda menonton XYZ, kami merekomendasikan film berikut.”

Tantangan utama dalam arahan transparansi di atas adalah bahwa representasi yang dipelajari biasanya berkenaan dengan “genre” yang belum tentu dapat dibaca manusia atau setidaknya tidak segera berwawasan bagi seseorang hanya dengan inspeksi.

Baik. Anda menyebutkan sebelumnya bahwa dalam contoh film, genre yang diberikan oleh studio film mungkin berbeda dari genre yang ditetapkan model pembelajaran mesin berdasarkan cara kita berinteraksi dengan konten.

Contoh Netflix dapat berupa serangkaian film yang tidak memiliki kesamaan jelas di antara mereka selain fakta bahwa ironisnya kebanyakan orang menontonnya, seperti “The Room”.

Ini bukanlah genre yang mudah untuk didefinisikan, tetapi sangat membantu dalam memahami bagaimana pengguna sebenarnya menikmati konten, mungkin berbeda dari yang dibayangkan oleh pembuatnya. Kembali ke analogi spreadsheet, fakta bahwa kolom-kolom di lembar Excel representasi yang dipelajari tidak selalu intuitif, sangat menantang untuk memberikan penjelasan atau pembenaran yang dapat dipahami sepenuhnya berdasarkan kolom-kolom tersebut. Misalnya, karena Anda memiliki skor tinggi dalam kategori ini, Facebook menampilkan kiriman ini, tetapi “kategori ini” tidak mudah dijelaskan dengan kata-kata. Ini lebih cenderung menjadi kombinasi dari kategori seperti itu, yang semakin memperumit gambar.

Sepertinya salah satu cara untuk membuat celah dalam gelembung filter adalah dengan mendiversifikasi cara kita terlibat dengan konten untuk mendorong model ke arah lain?

Saya, secara pribadi, terkadang berusaha keras untuk mengidentifikasi sumber konten yang mungkin tidak akan dibagikan dan dilibatkan oleh lingkaran sosial daring langsung saya dengan mereka sehingga saya memberi sinyal kepada model bahwa ini adalah bagian dari hal-hal yang ingin saya lihat lebih banyak.

Dari sudut pandang pembelajaran mesin, kami harus menentukan batasan tambahan tentang cara mengukur kinerja algoritme yang entah bagaimana akan menyandikan keragaman konten. Ini adalah masalah penelitian yang sangat menantang, terutama mengingat sulitnya mengukur tujuan itu dengan cara yang unik.

Ada banyak penelitian menarik yang membahas tentang diversifikasi rekomendasi konten dan meledakkan gelembung filter, dan ini sebenarnya merupakan masalah penelitian yang sangat menantang. Posting blog AI Facebook yang berwawasan berbicara sedikit tentang bagaimana hal ini dilakukan dalam fungsi Jelajahi Instagram, di mana mereka mencoba untuk mencegah menampilkan konten dari pengguna yang sama sangat sering untuk memungkinkan algoritma mengambil konten dari akun lain yang diharapkan dapat menjadi sedikit lebih beragam.

Apakah Anda punya rekomendasi bagaimana orang dapat belajar mengenali dan mengelola reaksi dan perilaku online mereka sendiri sehingga mereka tidak tinggal di ruang gema?

Penting untuk diinternalisasi bahwa di semua platform yang entah bagaimana memberi peringkat konten mereka, apa yang ditampilkan kepada kami hanyalah sebagian kecil dari apa yang ada di luar sana. Berfokus hanya pada sebagian belum tentu merupakan hal yang buruk, karena ada begitu banyak konten yang bersaing untuk mendapatkan perhatian kita sehingga dengan cepat akan menghabiskan perhatian dan kemampuan kita untuk belajar atau menikmati apa pun.

Saya melihat sistem peringkat / rekomendasi tersebut sebagai asisten berbasis pembelajaran mesin yang melakukan yang terbaik untuk memahami apa yang saya suka, tetapi terkadang itu juga bisa mendapatkan visi terowongan dan mungkin saya dapat mencoba memberi mereka lebih banyak informasi dengan sedikit lebih sengaja. Namun, sangat penting untuk memahami fakta tersebut karena jika kita menggabungkan apa yang kita lihat di feed kita dengan apa yang kita anggap sebagai totalitas dari hal-hal yang dibagikan secara online, hal ini dapat menyebabkan gelembung filter.

Untuk memahami dampak tindakan online kami di platform terhadap konten yang kami sajikan berikutnya, ini adalah eksperimen yang menyenangkan untuk dicoba dan, misalnya, menyukai setiap gambar anjing tetapi bukan kucing selama beberapa hari dan mengamati apa yang terjadi pada postingan yang Anda lihat setelah itu. Selanjutnya, setelah beberapa hari mengamati perubahan apa pun, secara eksplisit cari akun yang juga berbagi gambar kucing dan suka kucing dan anjing konten dalam jumlah yang sama, dan kemudian amati bagaimana rekomendasi yang Anda dapatkan berubah.

Yang kami kontrol dalam sistem tersebut adalah data yang kami buat dan dimasukkan ke dalam model pembelajaran mesin. Jadi, jika kita sedikit lebih khusus tentang bagaimana kita membuat data itu, ini juga dapat membantu mendorong model untuk meningkatkan keragaman preferensi kita. Bagaimana ini diterjemahkan ke dalam praktik? Misalnya, dalam memecahkan gelembung filter konten terkait berita yang kita lihat, adalah ide yang baik untuk secara aktif mencari outlet berita terkemuka yang menjangkau spektrum ideologis dan mengikutinya, dengan demikian terlibat dengan konten mereka secara luas, meskipun mungkin Lingkaran sosial langsung kita mungkin berbagi hal-hal dari bagian spektrum itu.


AI dapat memprediksi pengguna Twitter yang cenderung menyebarkan disinformasi sebelum mereka melakukannya


Disediakan oleh University of California – Riverside

Kutipan: Cara memecahkan gelembung Anda: Memperluas cakrawala media sosial Anda (2021, 4 Februari) diakses pada 4 Februari 2021 dari https://techxplore.com/news/2021-02-broadening-social-media-horizons.html

Dokumen ini memiliki hak cipta. Selain dari transaksi yang adil untuk tujuan studi atau penelitian pribadi, tidak ada bagian yang boleh direproduksi tanpa izin tertulis. Konten disediakan untuk tujuan informasi saja.


Halaman Ini Di Persembahkan Oleh : Togel Singapore