Нещодавно представлена модель ШІ GPT-4o mini повністю замінить GPT 3.5

Час читання: 2 хв.

OpenAI оголосила про випуск нової моделі штучного інтелекту для ChatGPT, що отримала назву GPT-4o mini. Як випливає з назви, ця модель є компактнішою та оптимізованою для швидкості та ефективності.

GPT-4o mini розроблена для заміни моделі GPT-3.5 Turbo і позиціонується як «найекономічніша маленька модель OpenAI». Попередні тести підтвердили цю заяву: GPT-4o mini показала результат 82% у тесті MMLU (масове багатозадачне розуміння мови), тоді як GPT-3.5 Turbo набрала 70%. Конкурентні моделі, такі як Gemini 1.5 Flash (79%) та Claude 3 Haiku (75%), також не дотягують до нового інструмента.

GPT-4o mini демонструє особливі досягнення в задачах кодування. У тесті HumanEval, що вимірює продуктивність кодування, нова модель набрала 87,2%, у той час як Gemini Flash отримала 71,5%, а Claude Haiku – 75,9%. Незалежні тести від LMSYS також підтверджують високі результати моделі.

Нова модель є приблизно на 60% дешевшою за попередню. Розробники сплачують $0,15 за мільйон вхідних токенів і $0,60 за таку ж кількість вихідних токенів (токен – це невеликий фрагмент тексту: слово, склад чи символ).

GPT-4o mini націлена на розробників, які потребують ефективних і недорогих рішень для виконання повторюваних завдань або для паралельної роботи над кількома проектами. Модель має контекстне вікно на 128 000 токенів і оновлені знання до жовтня 2023 року. Інформація про кількість параметрів GPT-4o mini наразі не розголошена.

Також OpenAI представила новий захід безпеки, що стане першою в історії моделі GPT. Цей захід дозволяє системі надавати пріоритет певним інструкціям, що ускладнює обхід безпекових механізмів, таких як джейлбрейки.

GPT-4o mini вже доступна для розробників через API та приватних користувачів через браузер і додаток ChatGPT. Приватні користувачі можуть скористатися ШІ без активної підписки, тоді як корпоративним клієнтам слід чекати до 26 липня на активацію моделі.

Випуск GPT-4o mini є відповіддю OpenAI на зростаючий тиск конкурентів, таких як Google Gemini 1.5 Flash і Claude 3 Haiku від Anthropic. OpenAI зізналася, що запуск такої моделі затримався через пріоритети: компанія спочатку зосереджувалася на більших та складніших моделях, перш ніж помітити потребу в компактніших і ефективніших рішеннях.

Митник Михайло

Більшу частину свого дитинства Михайло провів, бавлячись із гаджетами та намагаючись з'ясувати, як вони працюють. Його захоплення технологіями призвело до того, що іграшкові роботи, радіокеровані машинки та навіть ігрові приставки часто розбирали на частини, які не підлягали ремонту. Якщо ви поставите йому провокаційне запитання на кшталт "Android чи iPhone?", ви отримаєте ретельний аналіз всіх "за" і "проти", а також есе на тисячу слів про те, як технології впливають на людство.