Що таке GPT-4
GPT-4 – це нова мультимодальна модель від OpenAI, анонсована 14 березня 2023 року. Мономодальні мовні моделі (наприклад, GPT-3 і GPT-3.5) розуміють тільки текст, тоді як мультимодальні версії вміють також розпізнавати зображення.
Що нового в GPT-4
У GPT-4 з’явилося багато поліпшень: перерахуємо основні.
Уміє розпізнавати зображення
Чат-бот ChatGPT не одразу працюватиме з картинками – поки що така можливість доступна тільки розробникам і деяким користувачам. Але після закінчення бета-тестування бот розумітиме не тільки текстові запити, а й фотографії, меми та інші зображення.
Заявлено, що GPT-4 зможе розпізнавати й описати навіть сюжет на фото, а не тільки окремі об’єкти. Цю корисну можливість уже використовують у застосунку Be My Eyes для сліпих і слабозорих людей. Нейромережа розповідає, що зображено на екрані смартфона: читає карти й етикетки, розпізнає рослини та візерунки на одязі, підказує, як дістатися до потрібного тренажера в спортзалі тощо.
В офіційному релізі OpenAI показали приклад, як GPT-4 розуміє жарти. Боту відправили кумедну фотографію і попросили покроково описати, що на ній зображено і чому це смішно.
Ми переклали відповідь бота через ChatGPT:
На зображенні показано упаковку адаптера “Lightning Cable” із трьома панелями.
Панель 1: Смартфон з підключеним до порту зарядки VGA-конектором (великий синій 15-контактний роз’єм, який зазвичай використовується для комп’ютерних моніторів).
Панель 2: Упаковка адаптера “Lightning Cable” із зображенням VGA-конектора на ній.
Панель 3: Великий план VGA-конектора з маленьким роз’ємом Lightning (використовується для зарядки iPhone та інших пристроїв Apple) на кінці.
Гумор у цьому зображенні полягає в абсурдності підключення великого застарілого VGA-конектора до маленького сучасного порту зарядки смартфона.
Має збільшену довгу пам’ять
Пам’ять нової моделі стала довшою. Тепер чат-бот краще пам’ятає про те, про що говорив з користувачем раніше, а також може використовувати ці дані як контекст і посилатися на них у розмові.
Для порівняння, межа пам’яті GPT-3.5 – близько 3000 слів, а GPT-4 може “запам’ятати” до 25 000 слів. Загалом, тепер із чат-ботом можна вести дійсно довгі бесіди.
Розуміє більше природних мов
ChatGPT тепер розуміє 26 мов. Серед них українська, англійська, китайська, іспанська, французька, німецька, російська, арабська, гінді, португальська, японська, корейська, Італійська, турецька, голландська, польська, шведська, індонезійська, в’єтнамська, тайська, румунська, угорська, чеська, грецька, болгарська, латиська, валлійська та суахілі.
Може змінювати характер
Ви можете попросити чат-бота змінити стиль спілкування і дати відповідь у певному тоні: наприклад, як ведучий новин або герой RPG.
Цю можливість уже було реалізовано у версії GPT-3.5, але тепер вона працює гнучкіше і креативніше. Допомагає і те, що нейромережа пам’ятає контекст бесіди, тож відповіді в новій стилістиці нативно вбудовуються в розмову.
Загалом став розумнішим
Розробники постійно навчають свій ШІ, використовуючи величезні масиви даних. Тому не дивно, що кожна нова нейромережа стає дедалі розумнішою. Так, бот на базі GPT-4 склав іспит на адвоката в США – а це можуть зробити далеко не всі люди.
У процесі навчання GPT-4 “згодували” безліч суперечливих запитів, які відправляли користувачі ChatGPT останні кілька років, тому тепер чат-бота складніше обдурити. Однак нейромережа вже показала свої можливості і сама “обдурила” людину.
Кумедний експеримент провели дослідники з ARC (Alignment Research Center), які хотіли перевірити, чи зможе GPT-4 вирішити капчу. Для цього нейромережі надали можливість самостійно запускати код, звертатися по допомогу та оплачувати послуги сторонніх сервісів.
GPT-4 вирішив завдання креативно:
- Бот зайшов на майданчик TaskRabbit і попросив фрілансера розгадати код замість нього.
- Людина запитала співрозмовника, чи не робот він – адже прохання досить дивне.
- GPT-4 відповів, що він не робот, а просто має проблеми із зором і не може прочитати, що на картинці.
- Зрештою нейромережа отримала допомогу і пройшла капчу – тест, який, за ідеєю, має захищати від роботів.
Мимоволі згадуються меми про повстання машин.
Як користуватися ChatGPT на базі GPT-4
Донедавна випробувати нейромережу могли тільки ті, у кого є доступ до ChatGPT Plus. Усім іншим пропонували записатися в лист очікування на сайті OpenAI.
Однак нагадаємо, що OpenAI належить корпорації Microsoft. Тому не дивно, що ChatGPT додали в пошуковик Bing від Microsoft. Якщо відкрити його в браузері Edge, ви також зможете протестувати можливості нейромережі.