Штучний інтелект з умінням міркувати: можливості моделі О1 від OpenAI

Реклама

ЗАРАЗ ЧИТАЮТЬ

Час читання: 2 хв.

OpenAI випустила нові мовні моделі під назвою o1, які здатні вирішувати складні завдання крок за кроком без необхідності довгих інструкцій. Ці моделі представлені в двох версіях: старша o1-preview і легша o1-mini, кожна з яких використовує новий механізм під назвою Chain of Thought. Цей механізм розбиває складне запитання на послідовні підзавдання, що дозволяє моделям крок за кроком доходити до відповіді. Хоча процес вимагає значних ресурсів і займає декілька хвилин, результати вражають: модель o1 значно перевершує GPT-4o у випадках, пов’язаних з програмуванням, олімпіадними задачами з математики та науковими запитами рівня PhD, показуючи від 78% до 89% правильних відповідей, порівняно з 11-56% у GPT-4o. Щодо програмування, модель o1 демонструє результати, подібні до золотих медалістів міжнародних конкурсів.

Ця висока точність досягається завдяки детальному аналізу та автоматичній корекції кожного етапу вирішення задачі. Моделі o1 не позиціонуються як заміна GPT-4o, оскільки остання краще підходить для загальних завдань та щоденних інтеракцій з багатьма мовами, у той час як o1 спрямована на складні та ресурсомісткі процеси. Доступ до цих моделей доступний передплатникам тарифів Plus та Team, з обмеженнями на кількість запитів щотижня: до 30 для o1-preview і до 50 для o1-mini. Через API користувачі п’ятого рівня можуть надсилати до 20 промптів на хвилину, з асоційованими витратами на кожен мільйон токенів, які складають:

Реклама
  • o1-preview: $15 на вхід і $60 на вихід;
  • o1-mini: $3 на вхід і $12 на вихід.

Найближчим часом доступ до o1-mini буде безкоштовним для усіх користувачів, які використовують безкоштовну версію ChatGPT.

OpenAI рекомендує короткі і прямі інструкції для використання моделей o1, оскільки для досягнення хороших результатів не потрібні довгі пояснення. Використання структурних роздільників, таких як потрійні лапки, XML-теги та заголовки розділів, допомагає прискорити процес розпізнавання. Моделі o1 вже мають вбудовані методи ланцюжка міркувань, тому класичний промпт-інженерінг стає зайвим. Використання чітких високорівневих завдань, таких як дослідження, програмування та математичні обчислення, є найефективнішим підходом до використання моделей o1.

Реклама

Вас також можуть зацікавити новини:

Не пропустіть

СВІЖІ НОВИНИ