Alat baru menyederhanakan berbagi data, menjaga privasi
Keamanan

Alat baru menyederhanakan berbagi data, menjaga privasi


Kredit: Domain Publik Unsplash / CC0

Perkenalkan Perusahaan X. Perusahaan X membuat produk populer yang digunakan banyak orang — bahkan jutaan orang — setiap hari. Suatu hari, Perusahaan X memutuskan ingin meningkatkan beberapa perangkat keras dalam produknya, yang diproduksi oleh Vendor Y. Untuk melakukan peningkatan ini, perusahaan perlu berbagi data dengan Vendor Y tentang bagaimana pelanggannya menggunakan produk tersebut.

Sayangnya, data tersebut mungkin berisi informasi pribadi tentang pelanggan Perusahaan X, jadi membagikannya akan melanggar privasi mereka. Perusahaan X tidak ingin melakukan itu, jadi mereka mengabaikan peluang perbaikan.

Menurut sebuah studi baru yang ditulis oleh para peneliti di CyLab dan IBM Universitas Carnegie Mellon, alat baru dapat membantu menghindari masalah privasi ini dalam berbagi data. Perusahaan, organisasi, dan pemerintah sama-sama harus menangani masalah ini di dunia Big Data saat ini. Studi ini dipresentasikan pada Konferensi Pengukuran Internet ACM minggu ini, di mana ia dinobatkan sebagai finalis dalam Penghargaan Kertas Terbaik konferensi tersebut.

Salah satu pendekatan yang telah digunakan untuk menghindari pelanggaran privasi adalah dengan mensintesis data baru yang meniru kumpulan data asli sambil mengabaikan informasi sensitif. Namun, ini lebih mudah diucapkan daripada dilakukan.

Tim peneliti membuat alat baru — dijuluki “DoppelGANger” —yang menggunakan jaringan adversarial generatif, atau GAN, yang menerapkan teknik pembelajaran mesin untuk menyintesis set data yang memiliki statistik yang sama dengan data “pelatihan” asli.

Pada set data yang mereka evaluasi, model yang dilatih dengan data sintetis yang diproduksi DoppelGANger memiliki akurasi hingga 43 persen lebih tinggi daripada model yang melatih data sintetis dari alat pesaing.

Sebagian besar alat saat ini membutuhkan keahlian dalam pemodelan matematika yang kompleks, yang menciptakan penghalang untuk berbagi data di berbagai tingkat keahlian. Namun, DoppelGANger memerlukan sedikit atau tanpa pengetahuan sebelumnya tentang set data dan konfigurasinya karena fakta bahwa GAN sendiri dapat menggeneralisasi di berbagai set data dan kasus penggunaan. Hal ini membuat alat tersebut sangat fleksibel, kata para peneliti, dan bahwa fleksibilitas adalah kunci untuk berbagi data dalam situasi keamanan siber.

“Kami percaya bahwa organisasi masa depan perlu secara fleksibel memanfaatkan semua data yang tersedia untuk dapat bereaksi terhadap lanskap serangan yang semakin didorong oleh data dan otomatis,” kata Vyas Sekar dari CyLab, seorang profesor di ECE dan co-advisor Lin. “Dalam hal ini, alat apa pun yang memfasilitasi berbagi data akan menjadi penting.”

Giulia Fanti dari CyLab, seorang profesor di ECE dan Ph.D. co-advisor, juga melihat alat tersebut bermanfaat bagi teknisi keamanan.

“Data jaringan sintetis dapat digunakan untuk membantu membuat testbed pelatihan yang realistis untuk teknisi keamanan jaringan tanpa mengekspos data yang nyata dan sensitif,” kata Fanti.

Langkah tim selanjutnya adalah memperluas ke kapabilitas alat, karena meskipun kinerjanya luar biasa, ini terbatas pada kumpulan data yang relatif sederhana.

“Banyak kumpulan data jaringan memerlukan kerumitan yang jauh lebih banyak daripada yang dapat ditangani DoppelGANger saat ini,” kata Lin.

Bagi mereka yang tertarik menggunakan alat ini, DoppelGANger bersumber terbuka di Github. Penelitian ini disponsori oleh National Science Foundation dan Army Research Laboratory.


Janji nyata dari data sintetis


Informasi lebih lanjut:
Menggunakan GAN untuk Berbagi Data Rangkaian Waktu Berjaringan: Tantangan, Janji Awal, dan Pertanyaan Terbuka, arXiv: 1909.13403 [cs.LG] arxiv.org/abs/1909.13403

Disediakan oleh Universitas Carnegie Mellon

Kutipan: Alat baru menyederhanakan berbagi data, menjaga privasi (2020, 29 Oktober), diakses 27 November 2020 dari https://techxplore.com/news/2020-10-tool-privacy.html

Dokumen ini memiliki hak cipta. Selain dari transaksi yang adil untuk tujuan studi atau penelitian pribadi, tidak ada bagian yang boleh direproduksi tanpa izin tertulis. Konten disediakan untuk tujuan informasi saja.


Halaman Ini Di Persembahkan Oleh : SGP Prize