Исследовательская группа Национальной лаборатории Лос-Аламос сделала значительный прорыв в области кибербезопасности, используя искусственный интеллект для улучшения анализа вредоносных программ на большом масштабе. Разработанный подход позволил значительно продвинуться в классификации вредоносного ПО для операционной системы Microsoft Windows и установить новый мировой рекорд в классификации семейств малвари.
“Методы искусственного интеллекта, разработанные для систем киберзащиты, включая системы анализа малвари на большом масштабе, должны учитывать реальные вызовы”, – отметил Максим Ерен, ученый отдела передовых исследований в области киберсистем Лос-Аламоса.
Исследование , опубликованное в журнале ACM Transactions on Privacy and Security, представляет инновационный метод использования ИИ, который является значительным прорывом в области классификации вредоносных программ для Windows. Методика достигает реалистичной классификации семейств малвари, используя полу-надзорные методы тензорного разложения и селективную классификацию, в частности, опцию отказа.
“Опция отказа – это способность модели говорить, ‘Я не знаю’, вместо того чтобы делать неверное решение, что дает модели возможность открытия знаний”, – сказал Ерен.
Этот новый метод может точно работать как с большими, так и с малыми наборами данных одновременно, что позволяет обнаруживать как редкие, так и распространенные семейства вредоносных программ. Он также может отклонять предсказания, если не уверен в своем ответе. Это может дать аналитикам безопасности уверенность в применении этих техник в практических ситуациях высокого риска, таких как киберзащита для обнаружения новых угроз.
“Насколько нам известно, наша работа устанавливает новый мировой рекорд, одновременно классифицируя беспрецедентное количество семейств малвари, превосходя предыдущие работы в 29 раз, помимо работы в крайне сложных реальных условиях ограниченных данных, экстремального дисбаланса классов и наличия новых семейств вредоносных программ”, – заявил Ерен.
Методы тензорного разложения, в сочетании с высокопроизводительными вычислениями и возможностями графических процессоров, теперь доступны в виде удобной для пользователя библиотеки Python на GitHub, что подчеркивает передовой характер подхода команды и открывает новые перспективы для улучшения мер кибербезопасности.