Google представила ШІ-модель Gemini 1.5 Pro, яка перевершує всі інші сучасні моделі

ЗАРАЗ ЧИТАЮТЬ

Час читання: 2 хв.

Минулого тижня компанія Google представила Gemini – свій новий бренд штучного інтелекту і відкрила доступ користувачам до моделей різних розмірів і рівнів складності. ШІ-модель Gemini 1.0 Pro, що належить до середнього рівня, вже застаріла. Google заявила, що їй на заміну прийшла Gemini 1.5 Pro, яка може обробляти набагато більше даних, ніж будь-яка інша сучасна ШІ-модель. Це ставить її в один ряд із найбільшою моделлю Google Ultra. Щоправда, побачити, на що здатна вдосконалена Pro-модель, зможуть лише кілька тестувальників.

Реклама

Нещодавно розробники Google опублікували статтю, в якій детально описується метод усунення вузького місця пам’яті в кластерах графічних процесорів. Раніше графічні процесори, на яких працював генеративний штучний інтелект, обробляли щедру порцію даних, а потім перераховували їх, коли приходив час передати їх іншому прискорювачу штучного інтелекту. Новий підхід дає змогу кожному обчислювальному блоку одночасно надсилати й отримувати схожі дані від інших частин кластера. Це покращує сприйняття моделі, даючи їй можливість одночасно обробляти більше інформації. Саме це призвело до такого швидкого оновлення до версії 1.5.

Один із найефективніших способів виміряти складність і, теоретично, корисність моделі – це порівняти кількість токенів, які вона може обробити. Токен – це просто фрагмент даних, розбитий на фрагменти, що легко засвоюються, – числа, слова або частини слів. Gemini 1.0 Pro працював із 32 000 токенів, тоді як у конкурента ChatGPT-4 Turbo їх 128 000. Чат-бот Claude від Anthropic був попереднім лідером із вікном фрейму в 200 000 токенів. Gemini 1.5 Pro може працювати з 10 мільйонами токенів, але звичайні користувачі поки не отримали доступ до цієї версії.

Gemini 1.5 Pro – це мультимодальний штучний інтелект, а це означає, що ви можете передавати йому текст, зображення або навіть відео. Завдяки величезному контекстному вікну він може обробляти одну годину відео, 11 годин аудіо, 30 000 рядків коду або 700 000 слів. У відео вище Google надала Gemini 1.5 Pro всі 402 сторінки стенограми висадки “Аполлона-11” на Місяць (330 000 токенів). Модель може розуміти контекст і застосовувати логіку для пояснення змісту. Компанія заявила, що за можливостями він приблизно такий самий, як і його найбільша модель Gemini 1.0 Ultra, але потребує менше ресурсів.

Нова модель спочатку буде доступна тільки для розробників і корпоративних клієнтів. Стандартна версія Gemini 1.5 Pro, до якої отримають доступ звичайні користувачі, працюватиме тільки з 128 000 токенів. Наразі тестуються і більш потужні моделі з 1 мільйоном токенів, але поки що з невеликою групою розробників і вчених.

Google заявила, що для нової Gemini Pro з’являться моделі підписки, щойно будуть вирішені всі проблеми, але про ціни поки нічого не відомо. Це може сигналізувати про серйозні зміни в поширенні нового продукту. Зараз користувачі мають безкоштовний доступ до моделі Gemini 1.0 Pro, а доступ до версії Ultra коштує 20 доларів. Схоже, що ера безкоштовного доступу до ШІ-моделей добігає кінця, навіть якщо вам не потрібна опція Ultra.

Реклама

Вас також можуть зацікавити новини:

Підписуйтесь на нас в Google News, Facebook та TikTok 

Не пропустіть

СВІЖІ НОВИНИ