Metode menemukan sinyal peringatan tersembunyi dalam pengukuran yang dikumpulkan dari waktu ke waktu
Computer

Metode menemukan sinyal peringatan tersembunyi dalam pengukuran yang dikumpulkan dari waktu ke waktu


Peneliti MIT telah mengembangkan algoritma berbasis pembelajaran yang mendalam untuk mendeteksi anomali dalam data deret waktu. Kredit: MIT News

Saat Anda bertanggung jawab atas satelit bernilai jutaan dolar yang meluncur dengan kecepatan ribuan mil per jam, Anda ingin memastikannya berjalan dengan lancar. Dan deret waktu dapat membantu.

Deret waktu hanyalah catatan pengukuran yang dilakukan berulang kali dari waktu ke waktu. Itu dapat melacak tren jangka panjang sistem dan blip jangka pendek. Contohnya termasuk kurva COVID-19 yang terkenal dari kasus harian baru dan kurva Keeling yang telah melacak konsentrasi karbon dioksida di atmosfer sejak 1958. Di zaman data besar, “deret waktu dikumpulkan di semua tempat, dari satelit hingga turbin,” kata Kalyan Veeramachaneni. “Semua mesin itu memiliki sensor yang mengumpulkan rangkaian waktu ini tentang bagaimana mereka berfungsi.”

Namun menganalisis deret waktu tersebut, dan menandai titik data yang tidak wajar di dalamnya, bisa jadi rumit. Data bisa berisik. Jika operator satelit melihat serangkaian pembacaan suhu tinggi, bagaimana mereka tahu apakah itu fluktuasi yang tidak berbahaya atau tanda bahwa satelit akan mengalami panas berlebih?

Itulah masalah yang ingin dipecahkan oleh Veeramachaneni, yang memimpin grup Data-to-AI di Laboratorium Sistem Informasi dan Keputusan MIT. Grup telah mengembangkan metode baru berbasis pembelajaran mendalam untuk menandai anomali dalam data deret waktu. Pendekatan mereka, yang disebut TadGAN, mengungguli metode bersaing dan dapat membantu operator mendeteksi dan menanggapi perubahan besar dalam berbagai sistem bernilai tinggi, dari satelit yang terbang melintasi ruang angkasa hingga server komputer yang berdengung di ruang bawah tanah.

Penelitian ini akan dipresentasikan pada konferensi IEEE BigData bulan ini. Penulis makalah ini termasuk anggota grup Data-to-AI Veeramachaneni, postdoc Dongyu Liu, mahasiswa penelitian Alexander Geiger, dan mahasiswa master Sarah Alnegheimish, serta Alfredo Cuesta-Infante dari Universitas Rey Juan Carlos Spanyol.

Taruhan tinggi

Untuk sistem yang serumit satelit, analisis deret waktu harus otomatis. Perusahaan satelit SES, yang bekerja sama dengan Veeramachaneni, menerima banjir rangkaian waktu dari satelit komunikasinya — sekitar 30.000 parameter unik per pesawat ruang angkasa. Operator manusia di ruang kontrol SES hanya dapat melacak sebagian kecil dari deret waktu tersebut saat mereka berkedip di layar. Selebihnya, mereka mengandalkan sistem alarm untuk menandai nilai di luar kisaran. “Jadi mereka berkata kepada kami,” Bisakah Anda melakukan yang lebih baik? “, Kata Veeramachaneni. Perusahaan ingin timnya menggunakan pembelajaran mendalam untuk menganalisis semua deret waktu tersebut dan menandai perilaku yang tidak biasa.

Taruhannya tinggi untuk permintaan ini: Jika algoritme pembelajaran mendalam gagal mendeteksi anomali, tim dapat kehilangan kesempatan untuk memperbaiki berbagai hal. Tetapi jika alarm membunyikan alarm setiap kali ada titik data yang berisik, pengulas manusia akan membuang waktu mereka terus-menerus memeriksa algoritme yang berteriak serigala. “Jadi kami memiliki dua tantangan ini,” kata Liu. “Dan kita perlu menyeimbangkannya.”

Alih-alih mencapai keseimbangan itu hanya untuk sistem satelit, tim berusaha menciptakan kerangka kerja yang lebih umum untuk deteksi anomali — kerangka kerja yang dapat diterapkan di seluruh industri. Mereka beralih ke sistem pembelajaran mendalam yang disebut jaringan adversarial generatif (GAN), yang sering digunakan untuk analisis gambar.

GAN terdiri dari sepasang jaringan saraf. Satu jaringan, “generator”, membuat gambar palsu, sedangkan jaringan kedua, “diskriminator”, memproses gambar dan mencoba menentukan apakah itu gambar asli atau gambar palsu yang dihasilkan oleh generator. Melalui banyak putaran proses ini, generator belajar dari umpan balik diskriminator dan menjadi mahir dalam membuat pemalsuan hiper-realistis. Teknik ini dianggap sebagai pembelajaran “tanpa pengawasan”, karena tidak memerlukan kumpulan data prelabel di mana gambar diberi tag dengan subjeknya. (Kumpulan data berlabel besar mungkin sulit didapat.)

Tim mengadaptasi pendekatan GAN ini untuk data deret waktu. “Dari strategi pelatihan ini, model kami dapat mengetahui titik data mana yang normal dan mana yang tidak normal,” kata Liu. Ia melakukannya dengan memeriksa perbedaan — kemungkinan anomali — antara deret waktu nyata dan deret waktu palsu yang dibuat GAN. Tetapi tim menemukan bahwa GAN saja tidak cukup untuk deteksi anomali dalam deret waktu, karena GAN dapat gagal dalam menentukan segmen deret waktu nyata yang harus dibandingkan dengan yang palsu. Akibatnya, “jika Anda menggunakan GAN saja, Anda akan menciptakan banyak kesalahan positif,” kata Veeramachaneni.

Untuk mencegah kesalahan positif, tim melengkapi GAN mereka dengan algoritme yang disebut autoencoder — teknik lain untuk deep learning tanpa pengawasan. Berbeda dengan kecenderungan GAN untuk menangis serigala, autoencoder lebih cenderung melewatkan anomali yang sebenarnya. Itu karena autoencoder cenderung menangkap terlalu banyak pola dalam deret waktu, terkadang menafsirkan anomali aktual sebagai fluktuasi yang tidak berbahaya — masalah yang disebut “overfitting”. Dengan menggabungkan GAN dengan autoencoder, para peneliti membuat sistem deteksi anomali yang mencapai keseimbangan sempurna: TadGAN waspada, tetapi tidak menimbulkan terlalu banyak alarm palsu.

Teruji deret waktu

Plus, TadGAN berhasil memenangkan kompetisi. Pendekatan tradisional untuk peramalan deret waktu, yang disebut ARIMA, dikembangkan pada tahun 1970-an. “Kami ingin melihat sejauh mana kami telah berhasil, dan apakah model pembelajaran mendalam benar-benar dapat meningkatkan metode klasik ini,” kata Alnegheimish.

Tim menjalankan tes deteksi anomali pada 11 kumpulan data, mengadu ARIMA dengan TadGAN dan tujuh metode lainnya, termasuk beberapa yang dikembangkan oleh perusahaan seperti Amazon dan Microsoft. TadGAN mengungguli ARIMA dalam deteksi anomali untuk delapan dari 11 dataset. Algoritma terbaik kedua yang dikembangkan oleh Amazon hanya mengalahkan ARIMA untuk enam dataset.

Alnegheimish menekankan bahwa tujuan mereka tidak hanya untuk mengembangkan algoritme pendeteksi anomali terbaik, tetapi juga membuatnya dapat digunakan secara luas. “Kita semua tahu bahwa AI menderita masalah reproduktifitas,” katanya. Tim telah membuat kode TadGAN tersedia secara gratis, dan mereka mengeluarkan pembaruan berkala. Selain itu, mereka mengembangkan sistem pembandingan bagi pengguna untuk membandingkan kinerja berbagai model deteksi anomali.

“Tolok ukur ini adalah open source, jadi seseorang dapat mencobanya. Mereka dapat menambahkan model mereka sendiri jika mereka mau,” kata Alnegheimish. “Kami ingin mengurangi stigma seputar AI yang tidak dapat direproduksi. Kami ingin memastikan semuanya baik-baik saja.”

Veeramachaneni berharap TadGAN suatu hari nanti akan melayani berbagai industri, tidak hanya perusahaan satelit. Misalnya, dapat digunakan untuk memantau kinerja aplikasi komputer yang telah menjadi pusat perekonomian modern. “Untuk menjalankan lab, saya punya 30 aplikasi. Zoom, Slack, Github — sebut saja, saya punya,” katanya. “Dan saya mengandalkan mereka semua untuk bekerja dengan mulus dan selamanya.” Hal yang sama berlaku untuk jutaan pengguna di seluruh dunia.

TadGAN dapat membantu perusahaan seperti Zoom memantau sinyal deret waktu di pusat data mereka — seperti penggunaan CPU atau suhu — untuk membantu mencegah jeda layanan, yang dapat mengancam pangsa pasar perusahaan. Di masa mendatang, tim berencana untuk mengemas TadGAN dalam antarmuka pengguna, untuk membantu menghadirkan analisis deret waktu yang canggih kepada siapa pun yang membutuhkannya.


Janji nyata dari data sintetis


Informasi lebih lanjut:
TadGAN: Deteksi Anomali Rangkaian Waktu Menggunakan Jaringan Adversarial Generatif. arXiv: 2009.07769v3 [cs.LG] arxiv.org/abs/2009.07769

Disediakan oleh Massachusetts Institute of Technology

Kisah ini diterbitkan ulang atas izin MIT News (web.mit.edu/newsoffice/), situs populer yang meliput berita tentang penelitian, inovasi, dan pengajaran MIT.

Kutipan: Metode menemukan sinyal peringatan tersembunyi dalam pengukuran yang dikumpulkan dari waktu ke waktu (2020, 17 Desember), diakses 17 Desember 2020 dari https://techxplore.com/news/2020-12-method-hidden.html

Dokumen ini memiliki hak cipta. Selain dari transaksi yang adil untuk tujuan studi atau penelitian pribadi, tidak ada bagian yang boleh direproduksi tanpa izin tertulis. Konten disediakan untuk tujuan informasi saja.




Halaman Ini Di Persembahkan Oleh : Pengeluaran HK