Незважаючи на численні суперечності, остання модель штучного інтелекту від OpenAI, OpenAI o1, вже перевершила всі інші LLM, зайнявши перше місце в рейтингу Chatbot Arena. Вона випередила обидві попередні моделі OpenAI, а також своїх основних конкурентів – Google, xAI і Anthropic. OpenAI o1 була представлена всього десять днів тому.
У Chatbot Arena користувачі оцінюють результати роботи різних LLM, а платформа підраховує загальний бал і оцінює моделі в окремих категоріях, таких як мови, математика та програмування.
Наразі OpenAI o1 має 1335 балів, залишивши позаду всі інші LLM. Менша версія, OpenAI o1 mini, з меншою продуктивністю та нижчою вартістю, також показала вражаючі результати, поступившись лише Gemini 1.5 Pro від Google. Ось актуальний рейтинг:
Згідно з інформацією розробника, OpenAI o1 здатна виконувати завдання на рівні докторанта, імітуючи людське мислення. Модель може демонструвати користувачеві кроки вирішення завдань. Вже зараз платні підписники ChatGPT мають доступ до цієї технології.
Однак OpenAI o1 викликає суперечки, оскільки компанія віднесла її до категорії середнього ризику. Експерти можуть потенційно використовувати її для розробки біологічної зброї.
“Ми усвідомлюємо, що ці нові можливості можуть стати основою для небезпечних програм”, — зазначає розробник OpenAI.
Про заборону LLM наразі не йдеться, але влада уважно стежить за новими розробками. OpenAI, яка планує залучити 6,5 мільярда доларів інвестицій, має можливість обійти конкурентів, зокрема Google з її версією Gemini 1.5 і Anthropic, яка нещодавно випустила Claude 3.5. Зовсім недавно Grok від xAI, заснованого Ілоном Маском, потрапила до топ-10 найкращих AI-моделей, в той час як Llama 3.1 і моделі Mistral AI з Франції значно відстають.