Майбутнє ШІ для iPhone стало набагато цікавішим

ПРОДОВЖЕННЯ ПІСЛЯ РЕКЛАМИ

Нещодавно ходили чутки, що Apple працює над чимось під назвою Apple GPT, чатботом, заснованим на власній моделі ШІ компанії з метою емулювати те, що робить ChatGPT від OpenAI. У наступні місяці продукти з генеративним ШІ з’являлися всюди: від Google Pixels та телефонів Samsung Galaxy S24 до новачків на зразок Nothing Phone 2a.

Тим часом від Apple ми отримували лише туманні, але сміливі заяви. Генеральний директор Apple Тім Кук заявив інвесторам, що генеративний штучний інтелект Apple “відкриє нові можливості”, коли він з’явиться наприкінці цього року. Проте, зважаючи на все, для реалізації цих мрій Apple доведеться вдатися до допомоги Google. А може, OpenAI прийде на допомогу.

За даними Bloomberg, Apple веде переговори з Google щодо ліцензування моделей штучного інтелекту Gemini для iPhone. Це схоже на ту ж стратегію, якою дотримувалася Samsung щодо телефонів серії Galaxy S24, які можуть працювати з моделлю Gemini Nano від Google на пристрої, а потужніші версії доступні у хмарі.

ПРОДОВЖЕННЯ ПІСЛЯ РЕКЛАМИ

Умови угоди ще визначено, оскільки переговори перебувають у стадії обговорення. Проте, як повідомляється, Apple також веде переговори із OpenAI. Нагадаємо, що базові технології OpenAI, такі як модель GPT-4 та Dall-E, в даний час доступні в наборі продуктів Microsoft, а також в окремих додатках та сервісах, таких як ChatGPT Plus. Це цікава подія в амбіціях Apple в області ШІ, яка мене однаково хвилює і турбує.

Шлях Apple в області ШІ (на даний момент)

В останньому місяці 2023 року Apple без особливого галасу представила ряд бібліотек моделей і фреймворків під групою MLX, призначених для роботи на її власному кремнії. Цей крок повинен привнести до серії Mac можливості генеративного штучного інтелекту, аналогічні починанням Qualcomm із платформою Snapdragon X Elite.

На початку цього року дослідницький підрозділ Apple представив документ про інструмент генеративного ШІ під назвою Keyframer, що дозволяє користувачам створювати анімаційний контент. В його основі лежить модель GPT-4 від OpenAI, але він включає векторну графіку для обробки нерухомих зображень.

Крім того, фахівці Apple опублікували наукову працю, в якій описується інструмент штучного інтелекту, що полегшує редагування зображень за допомогою простих словесних інструкцій. Ця функція нагадує набір інструментів для редагування мультимедіа із голосовим супроводом, про який говорять нові чіпи Snapdragon від Qualcomm.

У наступному звіті Bloomberg наголошується, що Apple розширює свою спеціальну команду, відповідальну за вивчення функцій генеративного ШІ, з великою метою зробити ці інструменти доступними для розробників до 2024 року.

За чутками, дебютна партія функцій генеративного штучного інтелекту Apple з’явиться у iOS 18, презентація якої запланована на червень. Але, згідно з останнім звітом Bloomberg, ці функції орієнтовані на нативні системи на пристроях, а не на генеративний ШІ, який зазвичай підключається до хмари, як, наприклад, ChatGPT, Gemini або Perplexity.

У вересні видання The Information повідомило, що Apple розробляє базові моделі, спрямовані на вдосконалення Siri. Ця ініціатива, ймовірно, схожа на те, як Gemini просуває Google Assistant.

Що Gemini може робити на iPhone?

Тепер Gemini надає багато можливостей для телефону при локальній роботі та при підключенні до інтернету. При використанні на пристрої, як у випадку з Google Pixel 8 Pro, він може узагальнювати розмови в Recorder, навіть коли телефон знаходиться в автономному режимі.

Для тих, хто використовує клавіатуру Gboard, Gemini Nano пропонує функцію Smart Reply, починаючи з таких програм, як WhatsApp. У двох словах, вона читає вашу розмову і, відповідно, пропонує відповіді, ґрунтуючись на контексті. ШІ на пристрої також додає автономні переклади – функція, яка вже постачається на телефони Samsung Galaxy S24, які підтримують Gemini.

Зараз, коли програма Gemini встановлена ​​на телефоні, вона може виконувати наступні завдання.

  • Подібно до Google Assistant або ChatGPT, ви можете спілкуватися з Gemini природною мовою і отримувати допомогу в написанні текстів, придумуванні ідей і т.д.
  • Активувавши розширення Workspace, ви зможете швидко узагальнювати інформацію у своїх листах чи файлах. Інформація може бути узагальнена у таких форматах, як списки, діаграми та таблиці.
  • Генеруйте зображення за допомогою текстових підказок, як движок Dall-E від OpenAI.
  • Отримайте допомогу у використанні камери по-новому. У програмі Gemini наведіть камеру на сцену і запитайте інформацію про об’єкти в кадрі.
  • Зрозумійте, що на вашому екрані. Викличте Gemini командою “Hey Google”, щоб він виконав завдання. Наприклад, він може коротко викласти зміст статті, яку ви зараз читаєте.
  • Використовуйте Google Maps та Google Flights, щоб планувати поїздки та навіть створювати індивідуальні маршрути.

Як може виглядати угода між Apple та Google щодо створення штучного інтелекту

Як згадувалося вище, Samsung тісно співпрацювала з Google, щоб запустити модель штучного інтелекту Gemini Nano на своїх флагманських телефонах. Але Gemini не обмежується лише флагманами. У лютому цього року компанія MediaTek оголосила, що її кремній середньої цінової категорії Dimensity 8300 тепер оптимізовано для Google Gemini поряд із флагманським Dimensity 9300.

Зробити щось подібне для Apple не складе особливих труднощів. Якщо ліцензування пристроїв не вдасться, завжди використовується шлях додатків. На даний момент неясно, яку стратегію реалізує Apple, якщо, звичайно, угода відбудеться.

Більш важливе питання полягає в тому, чи змінить ліцензійна угода з Gemini те, як користувачі взаємодіють зі своїми iPhone. І що ще важливіше, чи сприятиме Gemini будь-яким змінам у Siri? Говорячи прямо, Siri має ще багато зробити, перш ніж вона зможе наздогнати Google Assistant.

Але навіть Google ще не до кінця розібралася, де Gemini існує, а де повністю замінює Google Assistant. Зараз, коли ви встановлюєте Gemini на Android телефон, він замінює Google Assistant. Або принаймні намагається це зробити.

Ваш телефон, як і раніше, покладається на Google Assistant при виконанні широкого спектру рутинних, але значущих завдань – таких як здійснення дзвінків, встановлення будильника, відправлення повідомлень, керування пристроями “розумного дому” та створення записів у календарі. Аналогічно, для навігації, голосового введення в Gboard та Android Auto Google Assistant, як і раніше, є надійним ШІ, а не Gemini.

Більш того, Google Assistant, як і раніше, є основним ШІ-компаньйоном на розумних дисплеях і смарт-годинниках Wear OS. Враховуючи, наскільки тісно Apple переплітає своє програмне забезпечення з апаратною екосистемою, особливо між iPhone та Apple Watch, поетапний підхід, при якому Gemini, Google Assistant та/або Siri будуть нести лише частину відповідальності, створить багато плутанини для пересічного користувача.

Як альтернатива Apple могла б тісно співпрацювати з Google і створити ексклюзивну інтеграцію, зв’язавши Gemini з такими функціями екосистеми Apple, як Siri, Mail, Notes, Safari, Calendar, Health та іншими. Однак, враховуючи поточний стан політики зберігання даних Gemini, ми не сподіваємося такої тісної інтеграції на рівні системи.

Ризики Gemini для Apple

Звичайно, Apple пропустила першу хвилю генеративного ШІ в смартфонах, і, якщо вірити повідомленням, компанія гарячково працює над тим, щоб надолужити втрачене. Але ліцензійна угода з Gemini також означає, що ми можемо ніколи не побачити власну роботу Apple з розробки генеративного ШІ в рамках проекту “Аякс”. Або, можливо, ми побачимо її тільки в розбавленому вигляді, поки Gemini займатиметься штучним інтелектом в iPhone.

Але Gemini не позбавлена ​​недоліків. Навпаки, він схибив більш дивним чином, ніж будь-який інший інструмент генеративного ШІ. Декілька тижнів тому користувачі Gemini помітили, що він видає вкрай неточні зображення, зокрема, неточно відображає колір шкіри, етнічну приналежність та історичну достовірність.

Суперечки розгорілися настільки, що Google призупинила створення тексту в зображення для Gemini. “Щоб бути зрозумілим, це абсолютно неприйнятно, і ми помилилися”, – написав генеральний директор Google Сундар Пічаї у внутрішній службовій записці, про яку повідомило агентство NPR.

По інший бік Атлантики компанія Gemini виявилася втягнута в іншу полеміку, коли її висловлювання на адресу прем’єр-міністра Індії Нарендри були принизливими і набули широкого розголосу в соціальних мережах. “Просто сказати: “Вибачте, це не було перевірено” – це не відповідає нашим очікуванням щодо дотримання закону”, – попередив (через NDTV) міністр Союзу Індії Раджив Чандрасекхар (Rajeev Chandrasekhar).

Суперечка знову привернула увагу до регулювання ШІ, і для великих гравців у сфері ІІ було випущено рекомендаційного листа, який вимагає отримати чіткий дозвіл перед публічним випуском таких інструментів, як Gemini.

Для компанії, яка також обережно ставиться до державного регулювання, як Apple, ліцензування Gemini для сотень мільйонів пристроїв по всьому світу – чималий ризик. Особливо якщо Google сама попереджає, що “Gemini буде робити помилки”, і каже, що завжди потрібно перевіряти ще раз неточності.

Якщо ви знайшли помилку, будь ласка, виділіть фрагмент тексту та натисніть Ctrl+Enter.