Ми вже деякий час користуємося зображеннями, згенерованими штучним інтелектом, але цього тижня деякі великі компанії зробили кілька важливих кроків вперед. Зокрема, йдеться про значні оновлення від Midjourney, нову модель від Google і розвиток Grok.
Кожна з компаній демонструє, як по-різному розвивається технологія, і що ще є багато простору для нововведень. Це все ще відкрите ігрове поле, і всі гравці показують, наскільки далеко просунулися їхні розробки.
Midjourney виходить в онлайн
Почнемо з Midjourney, яка наприкінці цього тижня без зайвого галасу випустила новий веб-редактор, що об’єднав у зручному інтерфейсі різноманітні інструменти для роботи із зображеннями.
Раніше такі функції, як рефреймінг, перемальовка (додавання нових елементів до вже існуючих зображень або їх зміна), панорамування, розширення полотна (збільшення меж зображення та заповнення новим контентом) і масштабування, вимагали використання окремих інструментів та були розташовані в різних меню, що ускладнювало процес редагування. Новий інтерфейс спрощує цей процес, роблячи його більш зручним та послідовним, порівняно з тим, що було раніше, коли програма тільки працювала через Discord.
Новий веб-редактор Midjourney значно покращує процес редагування зображень, створених за допомогою штучного інтелекту. Про це на Discord повідомив генеральний директор Midjourney Девід Хольц, зазначивши, що це “великий крок вперед”.
Попри те, що Midjourney поступово відходить від використання Discord і перетворюється на веб-додаток, компанія також оголосила, що буде дублювати повідомлення з популярних каналів, таких як “daily-theme”, “prompt-craft” та “general-1” між своїми веб-кімнатами та каналами Discord, щоб користувачі могли стежити за цими темами з будь-якої зручної для них платформи. Компанія також запровадила новий інструмент виділення, що працює як цифровий пензель, замінивши попередні інструменти для квадратного виділення та ласо.
Новий редактор доступний для всіх користувачів Midjourney, які вже створили понад 10 зображень на платформі. Перші відгуки від творців переважно позитивні.
Цей реліз з’явився через два тижні після випуску Midjourney 6.1, в якому було покращено якість та узгодженість зображень (наприклад, правильне відтворення кількості пальців), а також значно збільшено швидкість обробки та точність розуміння текстових підказок до зображень.
Grok-2 випускає монстра
Оновлення Midjourney також збіглося з випуском Grok-2 від стартапу Ілона Маска xAI, що стало ще однією важливою подією цього тижня.
Grok використовує модель Flux.1 від Black Forrest Lab для створення зображень, яка швидко набирає популярності завдяки високій якості зображень і безкоштовному доступу.
Однак, найбільше суперечок викликає не стільки якість Grok-2, яка досить висока, скільки його правила. На відміну від багатьох інших генераторів зображень, Grok-2 здається майже без обмежень щодо інтелектуальної власності, насильства та іншого чутливого контенту. Маск назвав його «найвеселішим ШІ у світі».
Люди вже випробували його можливості, створюючи дивні та жахливі образи, які нагадують ранні дні розвитку ШІ-зображень. Якщо вірити Маску, відсутність строгих рекомендацій у Grok-2 є навмисною і може вплинути на майбутній розвиток цієї технології.
Google стає конкурентоспроможним з Imagen 3
Зрештою, Google оголосила про запуск своєї нової моделі штучного інтелекту Imagen 3, яка тепер доступна всім користувачам у США. Google називає її “найякіснішою моделлю перетворення тексту на зображення”, здатною створювати зображення з “кращими деталями, більш насиченим освітленням і меншою кількістю артефактів, ніж попередні моделі”. Google також стверджує, що Imagen 3 краще справляється з відтворенням тексту та доступна в різних версіях для різних завдань: від швидких начерків до детальних зображень високої роздільної здатності.
Наразі Imagen 3 доступний лише через Google AI Test Kitchen у межах ImageFX. Це закрита бета-версія, тому потрібно стати в чергу, щоб отримати доступ, якщо ви ще не є її учасником.
Ряди "вінтажних" і "застарілих" пристроїв Apple поповнили одразу кілька гаджетів. Що ще відомо Нагадаємо, що…
Пам'ятаєте ті часи, коли телефони могли працювати кілька днів без підзарядки? Це було реально, особливо…
Компанія Xiaomi анонсувала вихід нової операційної системи HyperOS 2, яка буде заснована на Android 15.…
Бездротові технології продовжують розвиватися. Хоча організація IEEE ще не затвердила стандарт Wi-Fi 7, уже ведеться…
Здавалося б, південнокорейського гіганта Samsung Electronics вже довго переслідують невдачі, і котирування його акцій з…
Кілька днів тому в мережі з'явилася інформація, що Samsung проведе презентації серії Galaxy S25 вже…