Штучний інтелект зробив великий стрибок у генерації зображень

Час читання: 3 хв.

Ми вже деякий час користуємося зображеннями, згенерованими штучним інтелектом, але цього тижня деякі великі компанії зробили кілька важливих кроків вперед. Зокрема, йдеться про значні оновлення від Midjourney, нову модель від Google і розвиток Grok.

Кожна з компаній демонструє, як по-різному розвивається технологія, і що ще є багато простору для нововведень. Це все ще відкрите ігрове поле, і всі гравці показують, наскільки далеко просунулися їхні розробки.

Midjourney виходить в онлайн

Почнемо з Midjourney, яка наприкінці цього тижня без зайвого галасу випустила новий веб-редактор, що об’єднав у зручному інтерфейсі різноманітні інструменти для роботи із зображеннями.

Раніше такі функції, як рефреймінг, перемальовка (додавання нових елементів до вже існуючих зображень або їх зміна), панорамування, розширення полотна (збільшення меж зображення та заповнення новим контентом) і масштабування, вимагали використання окремих інструментів та були розташовані в різних меню, що ускладнювало процес редагування. Новий інтерфейс спрощує цей процес, роблячи його більш зручним та послідовним, порівняно з тим, що було раніше, коли програма тільки працювала через Discord.

Новий веб-редактор Midjourney значно покращує процес редагування зображень, створених за допомогою штучного інтелекту. Про це на Discord повідомив генеральний директор Midjourney Девід Хольц, зазначивши, що це “великий крок вперед”.

Попри те, що Midjourney поступово відходить від використання Discord і перетворюється на веб-додаток, компанія також оголосила, що буде дублювати повідомлення з популярних каналів, таких як “daily-theme”, “prompt-craft” та “general-1” між своїми веб-кімнатами та каналами Discord, щоб користувачі могли стежити за цими темами з будь-якої зручної для них платформи. Компанія також запровадила новий інструмент виділення, що працює як цифровий пензель, замінивши попередні інструменти для квадратного виділення та ласо.

Новий редактор доступний для всіх користувачів Midjourney, які вже створили понад 10 зображень на платформі. Перші відгуки від творців переважно позитивні.

Цей реліз з’явився через два тижні після випуску Midjourney 6.1, в якому було покращено якість та узгодженість зображень (наприклад, правильне відтворення кількості пальців), а також значно збільшено швидкість обробки та точність розуміння текстових підказок до зображень.

Grok-2 випускає монстра

Оновлення Midjourney також збіглося з випуском Grok-2 від стартапу Ілона Маска xAI, що стало ще однією важливою подією цього тижня.

Grok використовує модель Flux.1 від Black Forrest Lab для створення зображень, яка швидко набирає популярності завдяки високій якості зображень і безкоштовному доступу.

Однак, найбільше суперечок викликає не стільки якість Grok-2, яка досить висока, скільки його правила. На відміну від багатьох інших генераторів зображень, Grok-2 здається майже без обмежень щодо інтелектуальної власності, насильства та іншого чутливого контенту. Маск назвав його «найвеселішим ШІ у світі».

Люди вже випробували його можливості, створюючи дивні та жахливі образи, які нагадують ранні дні розвитку ШІ-зображень. Якщо вірити Маску, відсутність строгих рекомендацій у Grok-2 є навмисною і може вплинути на майбутній розвиток цієї технології.

Google стає конкурентоспроможним з Imagen 3

Зрештою, Google оголосила про запуск своєї нової моделі штучного інтелекту Imagen 3, яка тепер доступна всім користувачам у США. Google називає її “найякіснішою моделлю перетворення тексту на зображення”, здатною створювати зображення з “кращими деталями, більш насиченим освітленням і меншою кількістю артефактів, ніж попередні моделі”. Google також стверджує, що Imagen 3 краще справляється з відтворенням тексту та доступна в різних версіях для різних завдань: від швидких начерків до детальних зображень високої роздільної здатності.

Наразі Imagen 3 доступний лише через Google AI Test Kitchen у межах ImageFX. Це закрита бета-версія, тому потрібно стати в чергу, щоб отримати доступ, якщо ви ще не є її учасником.

Скарбик Павло

Закінчив Тернопільський національний технічний університет, почав писати про IT у 2015 році. Люблю розповідати про iPhone і Mac, автомобілі, їжу, гаджети розумного будинку і роблю огляди. Також захоплююся спортом а саме баскетболом і активним відпочинком на свіжому повітрі. Головний редактор iTechua.com.

Наступні Meta обіцяє нову еру VR з ультралегкою гарнітурою у 2027 році »

Попередні « 5 прихованих можливостей смартфона, які вас здивують

Залишити коментар

Опублікував

Скарбик Павло

Tags: Штучний інтелект

30.08.2024 14:50

Штучний інтелект змінить світ: прогноз Білла Гейтса на майбутнє

Протягом наступного десятиліття досягнення в галузі штучного інтелекту (ШІ) значно зменшать потребу в людській праці… Read More

Київстар оголосив про нову еру комунікацій в Україні

Національний мобільний оператор "Київстар" отримав дозвіл на використання нового коду мережі 707, що стане важливим… Read More

IBM звільняє працівників у США, але розширює штат в Індії

IBM планує скоротити близько 9 тис. робочих місць у США в 2025 році, але звільнені… Read More

Останні записи

Новини України та Світу

Штучний інтелект змінить світ: прогноз Білла Гейтса на майбутнє

Протягом наступного десятиліття досягнення в галузі штучного інтелекту (ШІ) значно зменшать потребу в людській праці…

30.03.2025

Новини України та Світу

Київстар оголосив про нову еру комунікацій в Україні

Національний мобільний оператор "Київстар" отримав дозвіл на використання нового коду мережі 707, що стане важливим…

30.03.2025

Смартфони

Samsung запатентувала смартфон з екраном, який може складатися на 360 градусів

Сучасні складані смартфони мають головний екран, який зазвичай складається всередину для захисту під час транспортування,…

30.03.2025

Новини України та Світу

IBM звільняє працівників у США, але розширює штат в Індії

IBM планує скоротити близько 9 тис. робочих місць у США в 2025 році, але звільнені…

30.03.2025

Новини України та Світу

Як правильно визначити точний час після переведення годинника

В ніч на 30 березня Україна перейшла на літній час, перевівши стрілки годинників на годину…

30.03.2025

Статті

Забуті функції смартфонів, які ми більше не використовуємо

Так, змін було чимало. Батареї Пам'ятаєте, як ми самі змінювали акумулятори в телефонах? Ще років…

29.03.2025

Штучний інтелект зробив великий стрибок у генерації зображень

Пов’язана публікація

Останні записи

Штучний інтелект змінить світ: прогноз Білла Гейтса на майбутнє

Київстар оголосив про нову еру комунікацій в Україні

Samsung запатентувала смартфон з екраном, який може складатися на 360 градусів

IBM звільняє працівників у США, але розширює штат в Індії

Як правильно визначити точний час після переведення годинника

Забуті функції смартфонів, які ми більше не використовуємо