GPT-4 – це нова мультимодальна модель від OpenAI, анонсована 14 березня 2023 року. Мономодальні мовні моделі (наприклад, GPT-3 і GPT-3.5) розуміють тільки текст, тоді як мультимодальні версії вміють також розпізнавати зображення.
У GPT-4 з’явилося багато поліпшень: перерахуємо основні.
Чат-бот ChatGPT не одразу працюватиме з картинками – поки що така можливість доступна тільки розробникам і деяким користувачам. Але після закінчення бета-тестування бот розумітиме не тільки текстові запити, а й фотографії, меми та інші зображення.
Заявлено, що GPT-4 зможе розпізнавати й описати навіть сюжет на фото, а не тільки окремі об’єкти. Цю корисну можливість уже використовують у застосунку Be My Eyes для сліпих і слабозорих людей. Нейромережа розповідає, що зображено на екрані смартфона: читає карти й етикетки, розпізнає рослини та візерунки на одязі, підказує, як дістатися до потрібного тренажера в спортзалі тощо.
В офіційному релізі OpenAI показали приклад, як GPT-4 розуміє жарти. Боту відправили кумедну фотографію і попросили покроково описати, що на ній зображено і чому це смішно.
Ми переклали відповідь бота через ChatGPT:
На зображенні показано упаковку адаптера “Lightning Cable” із трьома панелями.
Панель 1: Смартфон з підключеним до порту зарядки VGA-конектором (великий синій 15-контактний роз’єм, який зазвичай використовується для комп’ютерних моніторів).
Панель 2: Упаковка адаптера “Lightning Cable” із зображенням VGA-конектора на ній.
Панель 3: Великий план VGA-конектора з маленьким роз’ємом Lightning (використовується для зарядки iPhone та інших пристроїв Apple) на кінці.
Гумор у цьому зображенні полягає в абсурдності підключення великого застарілого VGA-конектора до маленького сучасного порту зарядки смартфона.
Пам’ять нової моделі стала довшою. Тепер чат-бот краще пам’ятає про те, про що говорив з користувачем раніше, а також може використовувати ці дані як контекст і посилатися на них у розмові.
Для порівняння, межа пам’яті GPT-3.5 – близько 3000 слів, а GPT-4 може “запам’ятати” до 25 000 слів. Загалом, тепер із чат-ботом можна вести дійсно довгі бесіди.
ChatGPT тепер розуміє 26 мов. Серед них українська, англійська, китайська, іспанська, французька, німецька, російська, арабська, гінді, португальська, японська, корейська, Італійська, турецька, голландська, польська, шведська, індонезійська, в’єтнамська, тайська, румунська, угорська, чеська, грецька, болгарська, латиська, валлійська та суахілі.
Ви можете попросити чат-бота змінити стиль спілкування і дати відповідь у певному тоні: наприклад, як ведучий новин або герой RPG.
Цю можливість уже було реалізовано у версії GPT-3.5, але тепер вона працює гнучкіше і креативніше. Допомагає і те, що нейромережа пам’ятає контекст бесіди, тож відповіді в новій стилістиці нативно вбудовуються в розмову.
Розробники постійно навчають свій ШІ, використовуючи величезні масиви даних. Тому не дивно, що кожна нова нейромережа стає дедалі розумнішою. Так, бот на базі GPT-4 склав іспит на адвоката в США – а це можуть зробити далеко не всі люди.
У процесі навчання GPT-4 “згодували” безліч суперечливих запитів, які відправляли користувачі ChatGPT останні кілька років, тому тепер чат-бота складніше обдурити. Однак нейромережа вже показала свої можливості і сама “обдурила” людину.
Кумедний експеримент провели дослідники з ARC (Alignment Research Center), які хотіли перевірити, чи зможе GPT-4 вирішити капчу. Для цього нейромережі надали можливість самостійно запускати код, звертатися по допомогу та оплачувати послуги сторонніх сервісів.
Мимоволі згадуються меми про повстання машин.
Донедавна випробувати нейромережу могли тільки ті, у кого є доступ до ChatGPT Plus. Усім іншим пропонували записатися в лист очікування на сайті OpenAI.
Однак нагадаємо, що OpenAI належить корпорації Microsoft. Тому не дивно, що ChatGPT додали в пошуковик Bing від Microsoft. Якщо відкрити його в браузері Edge, ви також зможете протестувати можливості нейромережі.
Надійний інсайдер під ніком OnLeaks опублікував серію деталізованих зображень ще не анонсованого смартфона. Крім того,…
Коли вийшла iOS 18, Apple додала дуже цікаву фішку. Тепер iPhone автоматично перезавантажується кожні три…
Щороку ми завантажуємо мільярди додатків на смартфони — щоб швидко спілкуватися, займатися банкінгом, редагувати фото…
В Android 15 QPR2 Beta 1 Google представила нову функцію - Terminal, що дозволяє запускати…
Apple Intelligence з'явився тільки минулого місяця, і деякі з його найцікавіших функцій будуть доступні з…
За останні кілька років все частіше виявляється, що месенджери використовуються як інструменти для злочинів. З…