Alat AI merangkum makalah yang panjang dalam satu kalimat
Computer

Alat AI merangkum makalah yang panjang dalam satu kalimat


Kredit: Pixabay / CC0 Domain Publik

Para sarjana memiliki cara yang bagus untuk mengingatkan kolega akan risalah panjang yang mereka anggap tidak sepadan dengan waktu mereka untuk dibaca.

Mereka menandai dokumen seperti itu “tl; dr” —terlalu lama, tidak terbaca.

Ini semacam putaran abad ke-21 dari gagasan Shakespeare’s Polonius yang berusia 420 tahun yang disampaikan kepada raja dan ratu dalam “Hamlet”: “Singkatnya,” dia menyarankan, “adalah jiwa kecerdasan.”

Institut Allen untuk Kecerdasan Buatan di Seattle telah mengambil kedua sentimen tersebut ke dalam hati dan minggu ini meluncurkan sebuah sistem yang menawarkan kondensasi ekstrim dari laporan ilmu komputer yang panjang untuk memangkas waktu yang diperlukan untuk meninjau literatur semacam itu.

Semantic Scholar adalah alat penelitian yang didukung oleh AI dan digunakan untuk penelitian ilmiah. Dengan fitur peringkasan barunya, ia mensurvei sejumlah besar makalah penelitian ilmiah dan menguranginya menjadi ringkasan satu kalimat. Lebih dari 7 juta pengguna setiap bulan telah mengakses Semantic Scholar.

Saat ini, terdapat 10 juta makalah ilmu komputer di database Semantic Scholar. Menurut Dan Weld yang membawahi database, secara bertahap akan ditambahkan makalah dari disiplin ilmu lain.

Sistem ini menawarkan keuntungan besar bagi para peneliti yang hingga kini harus bergantung pada pemindaian banyak judul dan seringkali abstrak yang panjang, khususnya tugas yang sulit dilakukan pada perangkat seluler. Setelah tes awal, reaksinya positif. “Orang-orang sepertinya sangat menyukainya,” kata Weld.

Ada berbagai program Pemrosesan Bahasa Alami yang dikembangkan selama bertahun-tahun untuk meringkas dokumen. Mereka umumnya menggunakan salah satu dari dua pendekatan: pendekatan ekstraktif berfokus pada pemilihan teks yang representatif dan menggunakannya secara kata demi kata dalam ringkasan. Misalnya, Paper Digest, yang dikembangkan pada tahun 2018, tampaknya mengekstrak kalimat kunci daripada menulis ulang temuan dengan kata-katanya sendiri.

Pendekatan lainnya adalah abstraktif; itu menggunakan algoritma generasi bahasa alami untuk membuat ringkasan dengan kata-kata asli. Peningkatan dalam pembuatan bahasa alami AI dalam beberapa tahun terakhir telah membuat pendekatan ini menjadi yang disukai di antara para programmer.

Sarjana Semantik terkenal karena mencapai tingkat kompresi terbesar dari semua alat ringkasan. Dengan makalah ilmiah yang memiliki rata-rata 5.000 kata, ringkasan Semantic Scholar sekitar 21 kata. Itu rata-rata untuk merangkum 1/238 ukuran laporan. Pesaing Semantic Scholar terdekat mengompresi dokumen menjadi hanya 1/36 dari ukuran laporan.

Menurut Jevin West, seorang ilmuwan informasi di University of Washington di Seattle yang menguji program baru tersebut, “Saya memperkirakan bahwa alat semacam ini akan menjadi fitur standar pencarian ilmiah dalam waktu dekat. Sebenarnya, dengan kebutuhan tersebut, saya kagum butuh waktu lama untuk melihatnya dalam praktik. “

Dia mencatat bahwa itu belum sempurna, “tetapi ini jelas merupakan langkah ke arah yang benar,” katanya.

Tim Allen Institute menyediakan kode mereka secara gratis. Mereka juga telah mendirikan tempat demonstrasi yang terbuka untuk semua orang. scitldr.apps.allenai.org/

Saat ini, hanya makalah yang ditulis dalam bahasa Inggris yang diterima. Tetapi penulis program berharap untuk memasukkan dokumen dalam bahasa lain pada akhirnya.


Mesin pencari gratis laboratorium AI Seattle bertujuan untuk mempercepat terobosan ilmiah


Informasi lebih lanjut:
github.com/allenai/scitldr

www.semanticscholar.org/

© 2020 Science X Network

Kutipan: Alat AI merangkum makalah panjang dalam satu kalimat (2020, 24 November), diakses 27 November 2020 dari https://techxplore.com/news/2020-11-ai-tool-lengthy-papers-sentence.html

Dokumen ini memiliki hak cipta. Selain dari transaksi yang adil untuk tujuan studi atau penelitian pribadi, tidak ada bagian yang boleh direproduksi tanpa izin tertulis. Konten disediakan untuk tujuan informasi saja.




Halaman Ini Di Persembahkan Oleh : Pengeluaran HK