Не дивно, що цьогорічна конференція розробників Google I / O присвячена штучному інтелекту. Компанія щойно представила більш вдосконалену версію Gemini1.5pro, потужного пакету штучного інтелекту нового покоління. В даний час Gemini1.5pro доступний розробникам і є мультимодальною мовною моделлю, яка працює з текстом, голосом та різними форматами вмісту.
Останнє оновлення Gemini1.5pro включає розширені контекстні вікна, покращені можливості аналізу даних, додаткову інтеграцію з Google Apps, розширені можливості налаштування та покращені ключові функції, такі як Переклад, кодування та логічний висновок.
Gemini 1.5 Flash
Google також представила Gemini 1.5 Flash – компактнішу модель, оптимізовану для вузьких або високочастотних завдань, де швидкість і час відгуку мають найбільше значення.
Придбати Microsoft Office для Windows/Mac за 25 доларів
І 1.5 Pro, і 1.5 Flash тепер підтримуватимуть контекстне вікно з 1 мільйоном маркерів, а 1.5 Pro Google також планує розширити цей показник до 2 мільйонів. Обидві моделі вже доступні для користувачів у 200 країнах як попередня версія, а загальне поширення очікується в червні. Більш довге контекстне вікно Однією з головних можливостей Gemini 1.5 Pro є покращене контекстне вікно в 1 мільйон жетонів, яке, як стверджується, є найдовшим серед усіх споживчих чат-ботів у світі.
Це означає, що тепер ШІ може осмислити безліч великих документів – до 1500 сторінок, або узагальнити близько 100 електронних листів. В кінцевому підсумку він також зможе обробляти годину відеоконтенту або кодові бази, що перевищують 30 000 рядків. Google також оголосила, що до кінця цього року вона має намір досягти контекстного вікна в 2 мільйони токенів, що ще більше розширить можливості ІІ. природною та інтуїтивною, Gemini матиме нову функцію Live, яка дозволить вам спілкуватися в більш розширеному режимі. Ви зможете не лише розмовляти з Gemini та робити запити, але й реагувати на різні звуки у навколишньому середовищі.
Наприклад, ви можете використовувати функцію Live в Gemini, щоб допомогти на співбесіді, підготувавшись і відрепетирувавши з вами та запропонувавши ключові навички, які потрібно підкреслити під час інтерв’ю. Крім того, в найближчому майбутньому Gemini зможе використовувати вашу камеру під час сеансів Live, сприяючи обговоренню навколишнього оточення. Більш глибока інтеграція з додатками Gemini 1.5 Pro також зосередиться на удосконаленні чата зі штучним інтелектом, щоб він міг працювати як універсальний цифровий допомога.
Для цього Google інтегрує Gemini з Google Calendar, Tasks і Keep, які скоро з’являться завдяки розширенням, представленим у платформі Bard минулого року. Це допоможе користувачам легко виконувати такі дії, як підбиття підсумків електронної пошти в Gmail, доступ до документів Google Docs або Drive , і навіть завантажувати зображення для таких завдань, як додавання подій в Календар Google або пунктів до списку покупок Google Keep. Мультимодальні можливості Gemini та пропоновані функції, такі як розпізнавання списків шкільних заходів з фотографій або складання списків інгредієнтів для рецептів, пропонують оптимізований підхід до організації повсякденних обов’язків. Google навіть анонсувала нову функцію AI Teammates для користувачів Workspace, яка дозволяє організувати віртуальних колег по всій компанії організації.
Передплатники Gemini Advanced скоро зможуть створювати Gems, адаптовану версію Gemini для більш індивідуальної взаємодії. Чи потрібний вам компаньйон під час тренувань, помічник у приготуванні їжі, помічник у кодуванні чи наставник у написанні текстів – Gemems можна налаштувати відповідно до ваших уподобань.
Просто викладіть завдання та бажані відповіді, і Gemini одним клацанням миші уточнить ваші інструкції, створивши Gem, що відповідає вашим унікальним вимогам.
Gemini торкнувся практично всіх анонсів, що пролунали на ключовій презентації, включаючи оновлення Android, Search, Gmail, Google Lens, Google Photos та інші.