Ще в листопаді 2024 року агентство Bloomberg повідомило, що OpenAI працює над ШІ-агентом під назвою Operator. Згідно зі звітом, інструмент може отримати прямий контроль над ПК. Після цього Operator, крім іншого, зможе писати код або самостійно бронювати поїздки. Розробник програмного забезпечення Тібор Блахо тепер стверджує, що знайшов нові докази існування ШІ-агента.
Що ще відомо
За словами Блахо, у застосунку ChatGPT для macOS є приховані опції, які можна використовувати для управління Operator. За даними американського видавництва The Information, випуск інструменту заплановано на січень 2025 року. Висновки Блахо могли б принаймні додатково підтвердити ці часові рамки. Але не тільки ці дані вказують на швидкий запуск ШІ-агента. За словами Блахо, на сайті OpenAI є й інші підказки. За його словами, там він виявив приховані посилання на Operator, які поки не опубліковані.
За словами Блахо, на сайті OpenAI розмістять таблиці, що порівнюють продуктивність інструменту з іншими комп’ютерними системами штучного інтелекту. На сайті OpenAI вже є посилання на Operator/OpenAI CUA (Computer Use Agent) – “Таблиця карт операторської системи”, “Таблиця оцінки досліджень операторів” і “Таблиця показників відмов операторів”.
Однак, як випливає з таблиці, інструмент не завжди настільки надійний. В OSWorld (тесті, що імітує комп’ютерні середовища) Operator зміг успішно виконати тільки 38,1 відсотка завдань. Для порівняння: у людей цей показник становить 72,4%.
Однак у тесті WebVoyager справи показники кращі. Тест дає змогу оцінити, наскільки добре людина чи ШІ вміє орієнтуватися та взаємодіяти з веб-сайтами. Тут інструмент, імовірно, досягає 82 відсотків ефективності. Однак поки невідомо, чи будуть ці цифри в кінцевому підсумку застосовні до готової версії ШІ-агента.