У середині вересня OpenAI представила нову модель штучного інтелекту під назвою o1, раніше відому як Strawberry. Цей чат-бот розроблений для вирішення складних завдань у галузях фізики, хімії та біології, наближаючи його здатність до людського мислення.
Попри досягнення, нова GPT-модель все ще припускається простих помилок. За даними OpenAI, ця версія продемонструвала рівень продуктивності, порівняний з аспірантом, у складних тестах. Проте з простими завданнями ШІ все ще має труднощі.
Наприклад, Матьє Ашер з Insa Rennes у Франції поділився на платформі X, що GPT-o1 робить нелогічні ходи у шахових головоломках, повторюючи типові помилки, вже відомі з GPT-4o та GPT-3.5. У шаховій позиції на четвертому ході ферзь робить неправильний хід на f7. Дослідник повторив експеримент п’ять разів, і результат був аналогічний.
Також інший дослідник, Колін Фрейзер, перевірив здатність моделі вирішувати прості логічні задачі, такі як питання про кількість переходів пастуха через річку з трьома вівцями. Чат-бот o1 дав неправильну відповідь.
Штучний інтелект Навид Могаддам знайшов ще одну типову помилку: якщо запитати, скільки разів буква “R” зустрічається у слові “Strawberry”, GPT-o1 дає неправильну відповідь, стверджуючи, що дві букви, замість трьох.
На цей момент GPT-o1 є тестовою версією, доступною лише для платних користувачів, і OpenAI визнала, що вона все ще на ранній стадії розвитку. Модель має недоліки в текстовій та графічній обробці, а також у відповідях на питання про актуальні події.
OpenAI обіцяє регулярні оновлення та значні покращення в майбутніх версіях. Дослідник Ноам Браун вважає, що в перспективі моделі ШІ можуть обмірковувати відповіді тижнями, що потенційно приведе до наукових проривів. Однак критики, такі як Гері Маркус, наголошують, що перед ШІ ще довгий шлях до досягнення справжніх революцій.