Penelitian baru membantu memerangi misinformasi media sosial
Internet

Penelitian baru membantu memerangi misinformasi media sosial


Anshumali Shrivastava adalah asisten profesor ilmu komputer di Universitas Rice. (Foto oleh Jeff Fitlow / Universitas Rice) Kredit: Jeff Fitlow / Universitas Rice

Peneliti Rice University telah menemukan cara yang lebih efisien bagi perusahaan media sosial untuk mencegah penyebaran informasi yang salah secara online menggunakan filter probabilistik yang dilatih dengan kecerdasan buatan.

Pendekatan baru untuk memindai media sosial diuraikan dalam sebuah penelitian yang dipresentasikan hari ini di Konferensi Sistem Pemrosesan Informasi Saraf (NeurIPS 2020) khusus online 2020 oleh ilmuwan komputer Rice Anshumali Shrivastava dan mahasiswa pascasarjana statistik Zhenwei Dai. Metode mereka menerapkan pembelajaran mesin dengan cara yang lebih cerdas untuk meningkatkan kinerja filter Bloom, teknik yang banyak digunakan yang dibuat setengah abad lalu.

Menggunakan basis data uji dari berita palsu dan virus komputer, Shrivastava dan Dai menunjukkan Adaptive Learned Bloom Filter (Ada-BF) mereka membutuhkan 50% lebih sedikit memori untuk mencapai tingkat kinerja yang sama seperti filter Bloom yang dipelajari.

Untuk menjelaskan pendekatan pemfilteran mereka, Shrivastava dan Dai mengutip beberapa data dari Twitter. Raksasa media sosial itu baru-baru ini mengungkapkan bahwa penggunanya menambahkan sekitar 500 juta tweet sehari, dan tweet biasanya muncul online satu detik setelah pengguna menekan tombol kirim.

“Sekitar waktu pemilihan, mereka mendapatkan sekitar 10.000 tweet per detik, dan dengan latensi satu detik itu sekitar enam tweet per milidetik,” kata Shrivastava. “Jika Anda ingin menerapkan filter yang membaca setiap tweet dan menandai yang berisi informasi yang diketahui palsu, mekanisme penandaan Anda tidak boleh lebih lambat dari enam milidetik atau Anda akan tertinggal dan tidak akan pernah bisa mengejar ketinggalan.”

Jika tweet yang ditandai dikirim untuk peninjauan manual tambahan, sangatlah penting untuk memiliki rasio positif palsu yang rendah. Dengan kata lain, Anda perlu meminimalkan berapa banyak tweet asli yang ditandai karena kesalahan.

“Jika rasio positif palsu Anda serendah 0,1%, maka Anda salah menandai 10 tweet per detik, atau lebih dari 800.000 per hari, untuk tinjauan manual,” katanya. “Inilah tepatnya mengapa sebagian besar pendekatan hanya AI tradisional menjadi penghalang untuk mengendalikan informasi yang salah.”

Shrivastava mengatakan Twitter tidak mengungkapkan metodenya untuk memfilter tweet, tetapi mereka diyakini menggunakan filter Bloom, teknik memori rendah yang ditemukan pada tahun 1970 untuk memeriksa apakah elemen data tertentu, seperti potongan kode komputer, adalah bagiannya. dari sekumpulan elemen yang diketahui, seperti database dari virus komputer yang diketahui. Filter Bloom dijamin untuk menemukan semua kode yang cocok dengan database, tetapi juga mencatat beberapa positif palsu.

“Katakanlah Anda telah mengidentifikasi informasi yang salah, dan Anda ingin memastikannya tidak tersebar di tweet,” kata Shrivastava. “Filter Bloom memungkinkan Anda memeriksa tweet dengan sangat cepat, dalam sepersejuta detik atau kurang. Jika dikatakan bahwa tweet bersih, tidak cocok dengan apa pun di database informasi yang salah, itu dijamin 100%. Jadi tidak ada kemungkinan menerima tweet dengan kesalahan informasi yang diketahui. Namun filter Bloom akan menandai tweet yang tidak berbahaya di sebagian kecil waktu. “

Dalam tiga tahun terakhir, para peneliti telah menawarkan berbagai skema untuk menggunakan pembelajaran mesin guna menambah filter Bloom dan meningkatkan efisiensinya. Perangkat lunak pengenalan bahasa dapat dilatih untuk mengenali dan menyetujui sebagian besar tweet, mengurangi volume yang perlu diproses dengan filter Bloom. Penggunaan pengklasifikasi pembelajaran mesin dapat menurunkan jumlah overhead komputasi yang diperlukan untuk memfilter data, memungkinkan perusahaan memproses lebih banyak informasi dalam waktu yang lebih singkat dengan sumber daya yang sama.

“Saat orang menggunakan model pembelajaran mesin saat ini, mereka membuang banyak informasi berguna yang berasal dari model pembelajaran mesin,” kata Dai.

Pendekatan tipikal adalah dengan menetapkan ambang toleransi dan mengirim semua yang berada di bawah ambang batas itu ke filter Bloom. Jika ambang batas keyakinan adalah 85%, itu berarti informasi yang dianggap aman oleh pengklasifikasi dengan tingkat keyakinan 80% menerima tingkat pemeriksaan yang sama dengan informasi yang hanya 10% yakin.

“Meskipun kami tidak dapat sepenuhnya mengandalkan pengklasifikasi pembelajaran mesin, ini masih memberi kami informasi berharga yang dapat mengurangi jumlah sumber daya filter Bloom,” kata Dai. “Apa yang telah kami lakukan adalah menerapkan sumber daya tersebut secara probabilistik. Kami memberikan lebih banyak sumber daya saat pengklasifikasi hanya 10% yakin versus sedikit kurang jika 20% yakin dan seterusnya. Kami mengambil seluruh spektrum pengklasifikasi dan menyelesaikannya dengan seluruh spektrum sumber daya yang dapat dialokasikan dari filter Bloom. “

Shrivastava mengatakan berkurangnya kebutuhan Ada-BF untuk memori diterjemahkan secara langsung ke kapasitas tambahan untuk sistem penyaringan real-time.

“Kami membutuhkan setengah dari ruang,” katanya. “Jadi pada dasarnya, kami dapat menangani informasi dua kali lebih banyak dengan sumber daya yang sama.”


Twitter mengatakan menandai 300.000 tweet pemilu yang ‘menyesatkan’


Disediakan oleh Universitas Rice

Kutipan: Berita buruk untuk berita palsu: Penelitian baru membantu memerangi misinformasi media sosial (2020, 10 Desember) diakses 10 Desember 2020 dari https://techxplore.com/news/2020-12-bad-news-fake-combat-social.html

Dokumen ini memiliki hak cipta. Selain dari transaksi yang adil untuk tujuan studi atau penelitian pribadi, tidak ada bagian yang boleh direproduksi tanpa izin tertulis. Konten disediakan untuk tujuan informasi saja.


Halaman Ini Di Persembahkan Oleh : Togel Singapore