Saat algoritme bersaing, siapa yang menang?
Sciences

Saat algoritme bersaing, siapa yang menang?


Perusahaan seperti layanan streaming online bersaing untuk memberikan rekomendasi terbaik. Tetapi dinamika umpan balik algoritme dapat menciptakan masalah nyata, penelitian baru menunjukkan. Kredit: Universitas Stanford

Seiring waktu, algoritme prediksi menjadi terspesialisasi untuk populasi yang semakin sempit, dan kualitas rata-rata prediksi mereka menurun.

Perusahaan seperti Netflix dan Hulu bersaing mendapatkan pelanggan untuk memastikan bisnis mereka berkembang. Namun ada jenis persaingan lain di tempat kerja yang menerima perhatian jauh lebih sedikit — persaingan di antara algoritme pembelajaran mesin yang digunakan oleh perusahaan pesaing semacam ini.

James Zou, asisten profesor Stanford untuk ilmu data biomedis dan anggota fakultas yang berafiliasi dari Stanford Institute for Human-Centered Artificial Intelligence, mengatakan bahwa saat algoritme bersaing untuk mendapatkan klik dan data pengguna terkait, algoritme menjadi lebih terspesialisasi untuk subpopulasi yang tertarik ke situs mereka. . Dan itu, dia menemukan dalam makalah baru dengan mahasiswa pascasarjana Antonio Ginart dan sarjana Eva Zhang, dapat memiliki implikasi serius bagi perusahaan dan konsumen.

Mungkin konsumen tidak keberatan jika rekomendasi Hulu tampaknya ditujukan untuk remaja perkotaan atau Netflix menawarkan pilihan yang lebih baik untuk pria pedesaan paruh baya, tetapi dalam hal memprediksi siapa yang harus menerima pinjaman bank atau resume siapa yang harus mencapai manajer perekrutan, algoritme ini memiliki akibat dunia nyata.

“Wawasan utamanya adalah hal ini terjadi bukan karena bisnis memilih untuk mengkhususkan diri pada kelompok usia atau demografis tertentu,” kata Ginart. “Ini terjadi karena dinamika umpan balik kompetisi.”

Spesialisasi yang Tak Terelakkan

Sebelum mereka memulai penelitian, tim Zou menyadari bahwa ada dinamika umpan balik yang berperan jika algoritme pembelajaran mesin perusahaan bersaing untuk mendapatkan pengguna atau pelanggan dan pada saat yang sama menggunakan data pelanggan untuk melatih model mereka. “Dengan memenangkan pelanggan, mereka mendapatkan sekumpulan data baru dari pelanggan tersebut, lalu dengan memperbarui model mereka pada kumpulan data baru ini, mereka benar-benar kemudian mengubah model dan mengarahkannya ke pelanggan baru yang telah mereka menangkan berakhir, “kata Ginart.

Tim bertanya-tanya: Bagaimana umpan balik tersebut memengaruhi kemampuan algoritme untuk memberikan rekomendasi yang berkualitas? Untuk mendapatkan jawaban, mereka menganalisis persaingan algoritmik secara matematis dan mensimulasikannya menggunakan beberapa dataset standar. Pada akhirnya, mereka menemukan bahwa saat algoritme pembelajaran mesin bersaing, mereka akhirnya (dan pasti) berspesialisasi, menjadi lebih baik dalam memprediksi preferensi subpopulasi pengguna.

“Tidak peduli berapa banyak data yang Anda miliki, Anda akan selalu melihat efek ini,” kata Zou. Selain itu, “Perbedaan menjadi semakin besar dari waktu ke waktu — semakin besar karena putaran umpan balik.”

Selain itu, tim tersebut menunjukkan bahwa di luar jumlah pesaing yang dapat dihitung secara matematis, kualitas prediksi menurun untuk populasi umum. “Sebenarnya ada sweet spot — jumlah pesaing optimal yang mengoptimalkan pengalaman pengguna,” kata Ginart. Di luar jumlah tersebut, setiap agen AI memiliki akses ke data dari sebagian kecil pengguna, mengurangi kemampuan mereka untuk menghasilkan prediksi yang berkualitas.

Teorema matematika tim berlaku setiap kali platform digital online bersaing untuk memberikan prediksi kepada pengguna, kata Ginart. Contoh di dunia nyata termasuk perusahaan yang menggunakan pembelajaran mesin untuk memprediksi preferensi hiburan pengguna (Netflix, Hulu, Amazon) atau selera restoran (Yelp, TripAdvisor), serta perusahaan yang berspesialisasi dalam pencarian, seperti Google, Bing, dan DuckDuckGo .

“Jika kami membuka Google atau Bing dan mengetik kueri penelusuran, Anda dapat mengatakan bahwa yang coba dilakukan Google adalah memprediksi tautan apa yang kami anggap paling relevan,” kata Ginart. Dan jika Bing melakukan pekerjaan yang lebih baik dalam membuat prediksi tersebut, mungkin kita akan lebih cenderung menggunakan platform tersebut, yang pada gilirannya mengubah masukan ke dalam sistem pembelajaran mesin dan mengubah cara membuat prediksi di masa mendatang.

Teorema juga berlaku untuk perusahaan yang memprediksi risiko kredit pengguna atau bahkan kemungkinan mereka akan memberikan jaminan. Misalnya, bank mungkin menjadi sangat pandai dalam memprediksi kelayakan kredit dari kelompok orang yang sangat spesifik — misalnya, orang yang berusia di atas 45 tahun atau orang dari kelompok pendapatan tertentu — hanya karena mereka telah mengumpulkan banyak data untuk kelompok tersebut . “Semakin banyak data yang mereka miliki untuk kelompok itu, semakin baik mereka dapat melayani mereka,” kata Ginart. Dan meskipun algoritme ini menjadi lebih baik dalam membuat prediksi yang akurat untuk satu subpopulasi, kualitas rata-rata layanan sebenarnya menurun karena prediksi mereka untuk grup lain menjadi semakin tidak akurat.

Bayangkan algoritme pinjaman bank yang mengandalkan data dari pelanggan kulit putih paruh baya dan karena itu mahir memprediksi anggota populasi mana yang akan menerima pinjaman. Perusahaan itu sebenarnya kehilangan kesempatan untuk secara akurat mengidentifikasi anggota kelompok lain (milenial Latinx, misalnya) yang juga berisiko kredit baik. Kegagalan itu, pada gilirannya, mengirim pelanggan tersebut ke tempat lain, memperkuat spesialisasi data algoritme, belum lagi menambah ketidaksetaraan struktural.

Mencari Solusi

Dalam langkah selanjutnya, tim sedang melihat pengaruh pembelian kumpulan data (daripada mengumpulkan data hanya dari pelanggan) terhadap persaingan algoritmik. Zou juga tertarik untuk mengidentifikasi beberapa solusi preskriptif yang dapat direkomendasikan timnya kepada pembuat kebijakan atau masing-masing perusahaan. “Apa yang kita lakukan untuk mengurangi bias semacam ini sekarang setelah kita mengidentifikasi masalahnya?” dia berkata.

“Ini masih sangat baru dan pekerjaan yang cukup mutakhir,” kata Zou. “Saya berharap makalah ini memicu para peneliti untuk mempelajari persaingan antara algoritma AI, serta dampak sosial dari persaingan tersebut.”


Pesan! AI menemukan materi yang tepat


Informasi lebih lanjut:
Ginart dkk. AI yang bersaing: Bagaimana umpan balik persaingan memengaruhi pembelajaran mesin? arXiv: 2009.06797 [cs.LG]. arxiv.org/abs/2009.06797

Disediakan oleh Universitas Stanford

Kutipan: Saat algoritme bersaing, siapa yang menang? (2020, 2 November) diakses 27 November 2020 dari https://techxplore.com/news/2020-11-algorithms.html

Dokumen ini memiliki hak cipta. Selain dari transaksi yang adil untuk tujuan studi atau penelitian pribadi, tidak ada bagian yang boleh direproduksi tanpa izin tertulis. Konten disediakan untuk tujuan informasi saja.


Halaman Ini Di Persembahkan Oleh : Hongkong Prize