OpenAI оголосила про випуск нової моделі штучного інтелекту для ChatGPT, що отримала назву GPT-4o mini. Як випливає з назви, ця модель є компактнішою та оптимізованою для швидкості та ефективності.
GPT-4o mini розроблена для заміни моделі GPT-3.5 Turbo і позиціонується як «найекономічніша маленька модель OpenAI». Попередні тести підтвердили цю заяву: GPT-4o mini показала результат 82% у тесті MMLU (масове багатозадачне розуміння мови), тоді як GPT-3.5 Turbo набрала 70%. Конкурентні моделі, такі як Gemini 1.5 Flash (79%) та Claude 3 Haiku (75%), також не дотягують до нового інструмента.
GPT-4o mini демонструє особливі досягнення в задачах кодування. У тесті HumanEval, що вимірює продуктивність кодування, нова модель набрала 87,2%, у той час як Gemini Flash отримала 71,5%, а Claude Haiku – 75,9%. Незалежні тести від LMSYS також підтверджують високі результати моделі.
Нова модель є приблизно на 60% дешевшою за попередню. Розробники сплачують $0,15 за мільйон вхідних токенів і $0,60 за таку ж кількість вихідних токенів (токен – це невеликий фрагмент тексту: слово, склад чи символ).
GPT-4o mini націлена на розробників, які потребують ефективних і недорогих рішень для виконання повторюваних завдань або для паралельної роботи над кількома проектами. Модель має контекстне вікно на 128 000 токенів і оновлені знання до жовтня 2023 року. Інформація про кількість параметрів GPT-4o mini наразі не розголошена.
Також OpenAI представила новий захід безпеки, що стане першою в історії моделі GPT. Цей захід дозволяє системі надавати пріоритет певним інструкціям, що ускладнює обхід безпекових механізмів, таких як джейлбрейки.
GPT-4o mini вже доступна для розробників через API та приватних користувачів через браузер і додаток ChatGPT. Приватні користувачі можуть скористатися ШІ без активної підписки, тоді як корпоративним клієнтам слід чекати до 26 липня на активацію моделі.
Випуск GPT-4o mini є відповіддю OpenAI на зростаючий тиск конкурентів, таких як Google Gemini 1.5 Flash і Claude 3 Haiku від Anthropic. OpenAI зізналася, що запуск такої моделі затримався через пріоритети: компанія спочатку зосереджувалася на більших та складніших моделях, перш ніж помітити потребу в компактніших і ефективніших рішеннях.