Menempatkan pembelajaran mesin di saku Anda
Spotlight

Aplikasi pembelajaran mesin membutuhkan lebih sedikit data daripada yang diasumsikan


Kredit: Pixabay/CC0 Domain Publik

Sebuah tim gabungan peneliti dari University of British Columbia dan University of Alberta telah menemukan bahwa setidaknya beberapa aplikasi pembelajaran mesin dapat belajar dari contoh yang jauh lebih sedikit daripada yang diasumsikan. Dalam makalah mereka yang diterbitkan di jurnal Kecerdasan Mesin Alam, grup tersebut menjelaskan pengujian yang mereka lakukan dengan aplikasi pembelajaran mesin yang dibuat untuk memprediksi jenis struktur molekul tertentu.

Pembelajaran mesin dapat digunakan dalam berbagai aplikasi—salah satu yang paling terkenal adalah belajar mengenali orang atau objek dalam foto. Aplikasi semacam itu biasanya membutuhkan sejumlah besar data untuk pelatihan. Dalam upaya baru ini, para peneliti telah menemukan bahwa dalam beberapa kasus, aplikasi pembelajaran mesin tidak memerlukan data dalam jumlah besar untuk berguna.

Para peneliti awalnya mencari cara untuk memprediksi struktur obat perancang ilegal. Melakukan hal itu akan membantu peneliti medis mempersiapkan mereka jika orang yang mengonsumsinya mulai muncul di ruang gawat darurat rumah sakit. Tim menyadari pekerjaan mereka akan jauh lebih mudah jika mereka dapat menggunakan aplikasi pembelajaran mesin; sayangnya, hanya ada 1.700 obat perancang yang diketahui dapat digunakan untuk melatih sistem seperti itu. Tanpa gentar, para peneliti bertanya-tanya apakah mungkin untuk mengetahui berapa banyak data yang diperlukan agar sistem seperti itu berguna, atau apakah mungkin ada cara untuk memodifikasi algoritma atau data yang digunakan untuk melatihnya agar memungkinkan untuk data yang tersedia lebih sedikit.

Untuk mengetahuinya, para peneliti membuat 8.500 model dan melatih masing-masing model pada kumpulan data berukuran berbeda yang diambil dari 500.000 molekul dalam sistem entri baris masukan molekul yang disederhanakan. Kemudian mereka menggunakan model untuk memprediksi kemungkinan jenis molekul. Dalam melakukannya, mereka menemukan banyak model bekerja cukup baik dengan dataset yang terbatas. Mereka juga menemukan bahwa sebagian besar dari mereka mulai mendatar dalam kemampuan prediksi mereka setelah hanya 10.000 hingga 20.000 catatan data. Ketika mereka menggunakan model berkinerja terbaik untuk melakukan penelitian awal mereka, mereka menemukan bahwa hasilnya benar sekitar 50% dari waktu.


Ahli kimia menunjukkan bagaimana bias muncul dalam hasil algoritma pembelajaran mesin


Informasi lebih lanjut:
Michael A. Skinnider dkk, Model bahasa kimia memungkinkan navigasi di ruang kimia yang jarang penduduknya, Kecerdasan Mesin Alam (2021). DOI: 10.1038 / s42256-021-00368-1

© 2021 Sains X Jaringan

Kutipan: Aplikasi pembelajaran mesin membutuhkan lebih sedikit data daripada yang diasumsikan (2021, 28 Juli) diambil 28 Juli 2021 dari https://techxplore.com/news/2021-07-machine-applications-assumed.html

Dokumen ini tunduk pada hak cipta. Terlepas dari transaksi wajar apa pun untuk tujuan studi atau penelitian pribadi, tidak ada bagian yang boleh direproduksi tanpa izin tertulis. Konten disediakan untuk tujuan informasi saja.


Halaman Ini Di Persembahkan Oleh : Pengeluaran SGP Hari Ini