Новини України та Світу

Попри оновлення, нова версія ChatGPT o1 допускає базові помилки

Share
Час читання: 2 хв.

У середині вересня OpenAI представила нову модель штучного інтелекту під назвою o1, раніше відому як Strawberry. Цей чат-бот розроблений для вирішення складних завдань у галузях фізики, хімії та біології, наближаючи його здатність до людського мислення.

Попри досягнення, нова GPT-модель все ще припускається простих помилок. За даними OpenAI, ця версія продемонструвала рівень продуктивності, порівняний з аспірантом, у складних тестах. Проте з простими завданнями ШІ все ще має труднощі.

Наприклад, Матьє Ашер з Insa Rennes у Франції поділився на платформі X, що GPT-o1 робить нелогічні ходи у шахових головоломках, повторюючи типові помилки, вже відомі з GPT-4o та GPT-3.5. У шаховій позиції на четвертому ході ферзь робить неправильний хід на f7. Дослідник повторив експеримент п’ять разів, і результат був аналогічний.

Також інший дослідник, Колін Фрейзер, перевірив здатність моделі вирішувати прості логічні задачі, такі як питання про кількість переходів пастуха через річку з трьома вівцями. Чат-бот o1 дав неправильну відповідь.

Штучний інтелект Навид Могаддам знайшов ще одну типову помилку: якщо запитати, скільки разів буква “R” зустрічається у слові “Strawberry”, GPT-o1 дає неправильну відповідь, стверджуючи, що дві букви, замість трьох.

На цей момент GPT-o1 є тестовою версією, доступною лише для платних користувачів, і OpenAI визнала, що вона все ще на ранній стадії розвитку. Модель має недоліки в текстовій та графічній обробці, а також у відповідях на питання про актуальні події.

OpenAI обіцяє регулярні оновлення та значні покращення в майбутніх версіях. Дослідник Ноам Браун вважає, що в перспективі моделі ШІ можуть обмірковувати відповіді тижнями, що потенційно приведе до наукових проривів. Однак критики, такі як Гері Маркус, наголошують, що перед ШІ ще довгий шлях до досягнення справжніх революцій.

Митник Михайло

Більшу частину свого дитинства Михайло провів, бавлячись із гаджетами та намагаючись з'ясувати, як вони працюють. Його захоплення технологіями призвело до того, що іграшкові роботи, радіокеровані машинки та навіть ігрові приставки часто розбирали на частини, які не підлягали ремонту. Якщо ви поставите йому провокаційне запитання на кшталт "Android чи iPhone?", ви отримаєте ретельний аналіз всіх "за" і "проти", а також есе на тисячу слів про те, як технології впливають на людство.

Опублікував
Митник Михайло
Tags: ChatGPT
  • Останні записи

    Перші тести iPhone 16: оцінка продуктивності в іграх і часу автономної роботи

    Apple зняла ембарго на публікацію оглядів нових iPhone, що дало змогу дізнатися більше про новинки.…

    18.09.2024

    Оновлення One UI 6.1.1 від Samsung знову викликало проблеми: камери флагманів Galaxy перестали працювати

    Нещодавно Samsung випустила велике оновлення One UI 6.1.1 для флагманської серії Galaxy S23, але вже…

    18.09.2024

    Розчарування від Samsung: ємність батареї Galaxy S25+ залишиться на рівні Galaxy S24+

    За інформацією ресурсу Galaxy Club, новий смартфон Samsung Galaxy S25+, який є другою за вартістю…

    18.09.2024

    Бюджетні моделі Samsung отримуватимуть оновлення до 6 років

    Samsung робить великий крок уперед, пропонуючи бюджетним смартфонам оновлення на шість років. Це нововведення ставить…

    18.09.2024

    Нові мови для Apple Intelligence будуть додаватися в 2025 році

    20 вересня на ринок надійдуть нові iPhone 16 — телефони, розроблені для роботи з функціями…

    18.09.2024

    Завод TSMC у США почав випуск процесорів для iPhone

    Завод TSMC в Арізоні розпочав виробництво пробної партії процесорів, і першим клієнтом став технологічний гігант…

    18.09.2024