Компанії Microsoft і Intel вдалися до вкрай новаторського і цікавого підходу в класифікації та визначенні шкідливого коду. Вони запустили проєкт STAMINA (Static Malware-as-Image Network Analysis), в рамках якого код програм конвертується в монохромне зображення, що піддається надалі аналізу з боку системи штучного інтелекту.
Двійковий код файлів перетворюється в простий потік пікселів, в результаті чого виходить картинка, параметри якої залежать від різних аспектів, в тому числі обсягу коду. Спеціально навчена нейромережа аналізує зображення і таким чином може виявляти в файлах ознаки зараження.
Проєкт STAMINA був натренований на величезному масиві даних, які компанія Microsoft зібрала за допомогою аналітики дистрибутивів, пропущених через антивірус Windows Defender на комп’ютерах мільйонів користувачів. Завдяки цьому нейромережа навчилася виявляти зараження в файлах, візуально порівнюючи їх з отриманим зображенням шкідливого коду.
Експериментальний антивірус, створений на основі STAMINA, на 99% точно класифікує шкідливий код, а помилка при визначенні вірусу становить менше 2,6%, що є дуже хорошим показником. Втім, у цього рішення є один дуже серйозний недолік: аналізувати можна тільки файли невеликого розміру, а з великим обсягом даних воно поки не справляється.