Новини України та Світу

Штучний інтелект зробив великий стрибок у генерації зображень

Share
Час читання: 3 хв.

Ми вже деякий час користуємося зображеннями, згенерованими штучним інтелектом, але цього тижня деякі великі компанії зробили кілька важливих кроків вперед. Зокрема, йдеться про значні оновлення від Midjourney, нову модель від Google і розвиток Grok.

Кожна з компаній демонструє, як по-різному розвивається технологія, і що ще є багато простору для нововведень. Це все ще відкрите ігрове поле, і всі гравці показують, наскільки далеко просунулися їхні розробки.

Midjourney виходить в онлайн

Почнемо з Midjourney, яка наприкінці цього тижня без зайвого галасу випустила новий веб-редактор, що об’єднав у зручному інтерфейсі різноманітні інструменти для роботи із зображеннями.

Раніше такі функції, як рефреймінг, перемальовка (додавання нових елементів до вже існуючих зображень або їх зміна), панорамування, розширення полотна (збільшення меж зображення та заповнення новим контентом) і масштабування, вимагали використання окремих інструментів та були розташовані в різних меню, що ускладнювало процес редагування. Новий інтерфейс спрощує цей процес, роблячи його більш зручним та послідовним, порівняно з тим, що було раніше, коли програма тільки працювала через Discord.

Новий веб-редактор Midjourney значно покращує процес редагування зображень, створених за допомогою штучного інтелекту. Про це на Discord повідомив генеральний директор Midjourney Девід Хольц, зазначивши, що це “великий крок вперед”.

Попри те, що Midjourney поступово відходить від використання Discord і перетворюється на веб-додаток, компанія також оголосила, що буде дублювати повідомлення з популярних каналів, таких як “daily-theme”, “prompt-craft” та “general-1” між своїми веб-кімнатами та каналами Discord, щоб користувачі могли стежити за цими темами з будь-якої зручної для них платформи. Компанія також запровадила новий інструмент виділення, що працює як цифровий пензель, замінивши попередні інструменти для квадратного виділення та ласо.

Новий редактор доступний для всіх користувачів Midjourney, які вже створили понад 10 зображень на платформі. Перші відгуки від творців переважно позитивні.

Цей реліз з’явився через два тижні після випуску Midjourney 6.1, в якому було покращено якість та узгодженість зображень (наприклад, правильне відтворення кількості пальців), а також значно збільшено швидкість обробки та точність розуміння текстових підказок до зображень.

Grok-2 випускає монстра

Оновлення Midjourney також збіглося з випуском Grok-2 від стартапу Ілона Маска xAI, що стало ще однією важливою подією цього тижня.

Grok використовує модель Flux.1 від Black Forrest Lab для створення зображень, яка швидко набирає популярності завдяки високій якості зображень і безкоштовному доступу.

Однак, найбільше суперечок викликає не стільки якість Grok-2, яка досить висока, скільки його правила. На відміну від багатьох інших генераторів зображень, Grok-2 здається майже без обмежень щодо інтелектуальної власності, насильства та іншого чутливого контенту. Маск назвав його «найвеселішим ШІ у світі».

Люди вже випробували його можливості, створюючи дивні та жахливі образи, які нагадують ранні дні розвитку ШІ-зображень. Якщо вірити Маску, відсутність строгих рекомендацій у Grok-2 є навмисною і може вплинути на майбутній розвиток цієї технології.

Google стає конкурентоспроможним з Imagen 3

Зрештою, Google оголосила про запуск своєї нової моделі штучного інтелекту Imagen 3, яка тепер доступна всім користувачам у США. Google називає її “найякіснішою моделлю перетворення тексту на зображення”, здатною створювати зображення з “кращими деталями, більш насиченим освітленням і меншою кількістю артефактів, ніж попередні моделі”. Google також стверджує, що Imagen 3 краще справляється з відтворенням тексту та доступна в різних версіях для різних завдань: від швидких начерків до детальних зображень високої роздільної здатності.

Наразі Imagen 3 доступний лише через Google AI Test Kitchen у межах ImageFX. Це закрита бета-версія, тому потрібно стати в чергу, щоб отримати доступ, якщо ви ще не є її учасником.

Скарбик Павло

Закінчив Тернопільський національний технічний університет, почав писати про IT у 2015 році. Люблю розповідати про iPhone і Mac, автомобілі, їжу, гаджети розумного будинку і роблю огляди. Також захоплююся спортом а саме баскетболом і активним відпочинком на свіжому повітрі. Головний редактор iTechua.com.

Опублікував
Скарбик Павло
  • Останні записи

    GPT-4 витрачає до трьох пляшок води на кожні 100 слів

    Дослідження, проведене Каліфорнійським університетом у Ріверсайді та опубліковане у The Washington Post, виявило високі витрати…

    19.09.2024

    Показано L-подібну батарею iPhone 16 Pro Max зі сталевою оболонкою

    Apple розпочне продажі iPhone 16 Pro Max та інших моделей 20 вересня, але деякі користувачі…

    19.09.2024

    Інсайдери: iPhone 17 отримає 3-нм чіпи, тоді як 2-нм техпроцес з’явиться лише у деяких версіях iPhone 18

    Лінійка iPhone 17, яка очікується наступного року, буде оснащена процесорами, виготовленими за вдосконаленою 3-нанометровою технологією…

    19.09.2024

    Експерт порівняв камери iPhone 16 Pro Max, Samsung Galaxy S24 Ultra та Google Pixel 9 Pro XL

    iPhone 16 Pro Max, який надійде у продаж завтра, вже пройшов тестування від численних блогерів,…

    19.09.2024

    Instagram зробив всі акаунти підлітків приватними

    Instagram представив новий пакет функцій для захисту підлітків, включаючи оновлені налаштування конфіденційності, посилений батьківський контроль…

    19.09.2024

    WhatsApp додасть ще одну популярну функцію з Telegram

    Розробники WhatsApp продовжують вдосконалювати функціонал свого популярного месенджера. Згідно з порталом WABetaInfo, наступне оновлення принесе…

    19.09.2024