Google Cendekia membuat dokumen yang bukan dalam bahasa Inggris menjadi tidak terlihat
Internet

Google Cendekia membuat dokumen yang bukan dalam bahasa Inggris menjadi tidak terlihat


Hasil Studi: Grafik menunjukkan bagaimana artikel yang ditulis dalam bahasa selain bahasa Inggris muncul di atas posisi 900 di peringkat Google Cendekia. Kredit: Universitat Pompeu Fabra – Barcelona

Visibilitas artikel ilmiah dan makalah konferensi bergantung pada kemudahan ditemukan di mesin telusur akademis, terutama Google Cendekia. Untuk meningkatkan visibilitas ini, pengoptimalan mesin telusur (SEO) telah diterapkan dalam beberapa tahun terakhir ke mesin telusur akademis untuk mengoptimalkan dokumen dan, dengan demikian, memastikan peringkatnya lebih baik di halaman penelusuran (yaitu, pengoptimalan mesin telusur akademis atau ASEO).

Penelitian terbaru, diterbitkan di Internet masa depan, telah mengetahui apakah bahasa dokumen merupakan faktor yang terlibat dalam algoritme pengurutan hasil penelusuran di Google Cendekia. Penulis penelitian adalah Cristòfol Rovira, Lluís Codina dan Carlos Lopezosa, anggota Departemen Komunikasi di UPF.

“Untuk menerapkan pengoptimalan ini, kami perlu lebih memahami pemahaman kami tentang algoritme peringkat relevansi Google Cendekia, sehingga, berdasarkan pengetahuan ini, kami dapat menyoroti atau meningkatkan karakteristik yang telah ada dalam dokumen akademik dan yang diperhitungkan oleh algoritme,” kata Rovira, penulis pertama studi tersebut. Untuk mencegah praktik penipuan, Google Cendekia tidak menjelaskan algoritme ini dan, oleh karena itu, penelitian semacam ini menjadi perlu.

Untuk penelitian tersebut, penulis menerapkan metodologi penelitian rekayasa terbalik berdasarkan analisis statistik dengan menggunakan koefisien korelasi Spearman. Tiga jenis pencarian dilakukan, menghasilkan sampel dari 45 pencarian masing-masing dengan 1.000 hasil (45.000 dokumen): menurut penulis, tahun, dan kata kunci.

Artikel berkualitas dengan ratusan kutipan diperlakukan secara diskriminatif

Hasilnya menunjukkan bahwa ketika pencarian dilakukan di Google Scholar dengan hasil dalam berbagai bahasa, sebagian besar (90%) dokumen dalam bahasa selain bahasa Inggris secara sistematis diturunkan ke posisi yang membuatnya sama sekali tidak terlihat. Dokumen-dokumen ini hampir selalu ditempatkan pada posisi di atas posisi peringkat 900, meskipun merupakan artikel berkualitas dengan ratusan sitasi. Dengan demikian, dapat dikatakan bahwa Google Scholar mendiskriminasi dokumen yang tidak ditulis dalam bahasa Inggris dalam pencarian dengan hasil multibahasa.

Kurangnya kesadaran akan faktor ini dapat merugikan para peneliti dari seluruh dunia yang tidak berbahasa Inggris, membuat mereka percaya bahwa tidak ada literatur dalam bahasa nasional mereka saat melakukan pencarian dengan hasil multibahasa.

“Ini terutama terjadi pada penelusuran yang paling sering dilakukan, yaitu yang dilakukan menurut tahun. Namun demikian, dapat juga terjadi dalam penelusuran menggunakan kata kunci tertentu yang sama dalam bahasa di seluruh dunia, termasuk merek dagang, senyawa kimia, produk industri, akronim, obat-obatan, dan penyakit, dengan COVID-19 menjadi contoh terbaru, “penulis penelitian mengungkapkan.

Dan mereka menambahkan “terlebih lagi, jika kita mempertimbangkan hasil studi ini dari perspektif ASEO, lebih dari bukti bahwa sampai bias ini diatasi, peluang untuk diberi peringkat dalam pencarian Google Cendekia multibahasa meningkat pesat jika para peneliti memilih untuk publikasi dalam bahasa Inggris. “

Grafik hasil penelitian

Scatter plot diatas merangkum hasil penelitian. Ada 45.000 titik, satu titik per dokumen. Titik abu-abu mewakili dokumen yang ditulis dalam bahasa Inggris, bahasa lain berwarna merah, dan biru menunjukkan posisi median.

Grafik menunjukkan bagaimana artikel yang ditulis dalam bahasa selain bahasa Inggris muncul di atas posisi 900 di peringkat Google Cendekia. Ini berlaku bahkan untuk dokumen berkualitas yang memiliki ratusan kutipan dan ditempatkan dengan baik di peringkat untuk jumlah kutipan.

Kasus yang paling mencolok adalah titik merah yang terletak di pojok kanan bawah. Mereka sesuai dengan dokumen yang ditulis dalam bahasa selain Inggris yang diberi peringkat berdasarkan jumlah kutipan di bawah 100 dan memiliki peringkat Google Cendekia di atas 900. Ini berarti bahwa semuanya menerima lebih dari seribu kutipan dan muncul di Google Cendekia pada posisi yang sama dengan dokumen dalam bahasa Inggris dikutip hanya beberapa lusin kali.


Berapa banyak makalah ilmiah yang ada di Web? Setidaknya 114 juta, profesor menemukan


Informasi lebih lanjut:
Cristòfol Rovira dkk, Bias Bahasa di Algoritma Peringkat Google Cendekia, Internet masa depan (2021). DOI: 10.3390 / fi13020031

Disediakan oleh Universitas Pompeu Fabra – Barcelona

Kutipan: Google Cendekia membuat dokumen yang tidak dalam bahasa Inggris menjadi tak terlihat (2021, 10 Februari) diambil 10 Februari 2021 dari https://techxplore.com/news/2021-02-google-scholar-documents-english-invisible.html

Dokumen ini memiliki hak cipta. Selain dari transaksi yang adil untuk tujuan studi atau penelitian pribadi, tidak ada bagian yang boleh direproduksi tanpa izin tertulis. Konten disediakan untuk tujuan informasi saja.


Halaman Ini Di Persembahkan Oleh : Togel Singapore