Ми вже деякий час користуємося зображеннями, згенерованими штучним інтелектом, але цього тижня деякі великі компанії зробили кілька важливих кроків вперед. Зокрема, йдеться про значні оновлення від Midjourney, нову модель від Google і розвиток Grok.
Кожна з компаній демонструє, як по-різному розвивається технологія, і що ще є багато простору для нововведень. Це все ще відкрите ігрове поле, і всі гравці показують, наскільки далеко просунулися їхні розробки.
Midjourney виходить в онлайн
Почнемо з Midjourney, яка наприкінці цього тижня без зайвого галасу випустила новий веб-редактор, що об’єднав у зручному інтерфейсі різноманітні інструменти для роботи із зображеннями.
Раніше такі функції, як рефреймінг, перемальовка (додавання нових елементів до вже існуючих зображень або їх зміна), панорамування, розширення полотна (збільшення меж зображення та заповнення новим контентом) і масштабування, вимагали використання окремих інструментів та були розташовані в різних меню, що ускладнювало процес редагування. Новий інтерфейс спрощує цей процес, роблячи його більш зручним та послідовним, порівняно з тим, що було раніше, коли програма тільки працювала через Discord.
Новий веб-редактор Midjourney значно покращує процес редагування зображень, створених за допомогою штучного інтелекту. Про це на Discord повідомив генеральний директор Midjourney Девід Хольц, зазначивши, що це “великий крок вперед”.
Попри те, що Midjourney поступово відходить від використання Discord і перетворюється на веб-додаток, компанія також оголосила, що буде дублювати повідомлення з популярних каналів, таких як “daily-theme”, “prompt-craft” та “general-1” між своїми веб-кімнатами та каналами Discord, щоб користувачі могли стежити за цими темами з будь-якої зручної для них платформи. Компанія також запровадила новий інструмент виділення, що працює як цифровий пензель, замінивши попередні інструменти для квадратного виділення та ласо.
Новий редактор доступний для всіх користувачів Midjourney, які вже створили понад 10 зображень на платформі. Перші відгуки від творців переважно позитивні.
Цей реліз з’явився через два тижні після випуску Midjourney 6.1, в якому було покращено якість та узгодженість зображень (наприклад, правильне відтворення кількості пальців), а також значно збільшено швидкість обробки та точність розуміння текстових підказок до зображень.
Grok-2 випускає монстра
Оновлення Midjourney також збіглося з випуском Grok-2 від стартапу Ілона Маска xAI, що стало ще однією важливою подією цього тижня.
Grok використовує модель Flux.1 від Black Forrest Lab для створення зображень, яка швидко набирає популярності завдяки високій якості зображень і безкоштовному доступу.
Однак, найбільше суперечок викликає не стільки якість Grok-2, яка досить висока, скільки його правила. На відміну від багатьох інших генераторів зображень, Grok-2 здається майже без обмежень щодо інтелектуальної власності, насильства та іншого чутливого контенту. Маск назвав його «найвеселішим ШІ у світі».
Люди вже випробували його можливості, створюючи дивні та жахливі образи, які нагадують ранні дні розвитку ШІ-зображень. Якщо вірити Маску, відсутність строгих рекомендацій у Grok-2 є навмисною і може вплинути на майбутній розвиток цієї технології.
Google стає конкурентоспроможним з Imagen 3
Зрештою, Google оголосила про запуск своєї нової моделі штучного інтелекту Imagen 3, яка тепер доступна всім користувачам у США. Google називає її “найякіснішою моделлю перетворення тексту на зображення”, здатною створювати зображення з “кращими деталями, більш насиченим освітленням і меншою кількістю артефактів, ніж попередні моделі”. Google також стверджує, що Imagen 3 краще справляється з відтворенням тексту та доступна в різних версіях для різних завдань: від швидких начерків до детальних зображень високої роздільної здатності.
Наразі Imagen 3 доступний лише через Google AI Test Kitchen у межах ImageFX. Це закрита бета-версія, тому потрібно стати в чергу, щоб отримати доступ, якщо ви ще не є її учасником.
Очікується, що Samsung представить серію Galaxy S25 вже в січні. Імовірно, це станеться 22 січня…
У запеклій конкуренції з Google компанія OpenAI зняла обмеження на доступ до ChatGPT Search для…
The Wall Street Journal стверджує, що ця модель не буде дорожчою за iPhone 17 Pro…
Нове опитування фахівців з компанії SellCell показує, що більшість функцій Apple Intelligence не несуть ніякої…
Ілон Маск підтвердив, що його команда соціальної мережі X (Twitter) працює над створенням фірмового сервісу…
Компанія Apple готує до виходу Macbook монструозних розмірів. Про це пише MacRumors. Що відомо Згідно…