Ide matematika yang secara dramatis dapat mengurangi ukuran kumpulan data yang diperlukan untuk melatih sistem AI
Sciences

Ide matematika yang secara dramatis dapat mengurangi ukuran kumpulan data yang diperlukan untuk melatih sistem AI


Kredit: CC0

Sepasang ahli statistik di University of Waterloo telah mengusulkan ide proses matematika yang memungkinkan pengajaran sistem AI tanpa memerlukan kumpulan data yang besar. Ilia Sucholutsky dan Matthias Schonlau telah menulis makalah yang menjelaskan ide mereka dan menerbitkannya di server pracetak arXiv.

Aplikasi kecerdasan buatan (AI) telah menjadi subjek banyak penelitian akhir-akhir ini, dengan perkembangan jaringan pembelajaran yang dalam, para peneliti di berbagai bidang mulai menemukan kegunaannya, termasuk membuat video deepfake, aplikasi permainan papan, dan diagnostik medis.

Jaringan pembelajaran mendalam memerlukan kumpulan data besar untuk mendeteksi pola yang mengungkapkan cara melakukan tugas tertentu, seperti memilih wajah tertentu dari kerumunan. Dalam upaya baru ini, para peneliti bertanya-tanya apakah mungkin ada cara untuk mengurangi ukuran kumpulan data. Mereka mencatat bahwa anak-anak hanya perlu melihat beberapa gambar binatang untuk mengenali contoh lain. Sebagai ahli statistik, mereka bertanya-tanya apakah mungkin ada cara menggunakan matematika untuk memecahkan masalah tersebut.

Para peneliti membangun pekerjaan terbaru oleh tim di MIT. Mereka telah menemukan bahwa menyaring informasi paling relevan yang menggambarkan angka tulisan tangan dalam kumpulan data yang dikenal sebagai MNIST dan mengemasnya bersama-sama sangat mengurangi jumlah karakter yang dibutuhkan sistem AI mereka untuk belajar mengenali huruf dalam kumpulan data baru. Pasangan di Kanada mencatat bahwa alasan sistem dapat belajar dengan lebih sedikit data adalah karena sistem dilatih untuk mengenali angka dengan cara baru: alih-alih hanya menunjukkan angka 3 ribuan kali, mereka melatihnya untuk mengenali bahwa target adalah angka yang terlihat (30 persen) seperti angka 8, dan seterusnya dengan angka lainnya. Mereka menyebut petunjuk ini label lembut.

Mereka kemudian mengambil ide ini lebih jauh dengan menerapkannya ke jenis pembelajaran mesin yang disebut k-tetangga terdekat (kNN), yang memungkinkan mereka untuk mentransfer ide mereka ke dalam pendekatan grafis. Dan dengan menggunakan pendekatan itu, mereka dapat menerapkan label lunak pada kumpulan data yang menggambarkan koordinat XY pada grafik. Hasilnya, sistem AI dengan mudah dilatih untuk menempatkan titik-titik pada grafik di sisi yang benar dari garis yang telah mereka gambar tanpa memerlukan kumpulan data yang besar. Para peneliti menggambarkan pendekatan mereka sebagai “pembelajaran kurang dari satu kesempatan” (LO-shot) dan menyarankan kemungkinan untuk memperluasnya ke area lain, meskipun mereka mengakui masih ada satu rintangan utama yang harus diatasi. Sistem masih membutuhkan set data yang besar untuk memulai proses penampian.


Metode pengenalan citra baru diusulkan berdasarkan kumpulan data skala besar


Informasi lebih lanjut:
Pembelajaran ‘Kurang dari Satu’: Mempelajari N Kelas Dari M arxiv.org/abs/2009.08449

© 2020 Science X Network

Kutipan: Ide matematika yang secara dramatis dapat mengurangi ukuran kumpulan data yang diperlukan untuk melatih sistem AI (2020, 23 Oktober) diambil pada 27 November 2020 dari https://techxplore.com/news/2020-10-math-idea-dataset-size-ai .html

Dokumen ini memiliki hak cipta. Selain dari transaksi yang adil untuk tujuan studi atau penelitian pribadi, tidak ada bagian yang boleh direproduksi tanpa izin tertulis. Konten disediakan untuk tujuan informasi saja.


Halaman Ini Di Persembahkan Oleh : Hongkong Prize