Модель штучного інтелекту GPT-4o, яка вийшла рік тому, отримала нові функції, зокрема генерацію зображень. Тепер ШІ може створювати детальні зображення за текстовими інструкціями і коригувати їх до тих пір, поки результат повністю не відповідатиме вашим уявленням.
Процес зазвичай починається з запиту, а потім ви можете вносити корективи. GPT-4o працює по-іншому: ви даєте перший запит, потім додаєте уточнення, поки не отримаєте ідеальний результат.
OpenAI вибирала кращі приклади — багато зображень були відзначені як «найкращі з 2» або «найкращі з 8». Інтерфейс простий, а результат чудовий.
GPT-4o може створювати зображення з нуля або змінювати вже готові. Наприклад, користувач завантажив фото кота і попросив додати йому капелюх детектива та монокль, а потім уточнив деталі, перетворивши картинку на сцену з гри.
Можна використовувати одразу кілька зображень та комбінувати елементи з кожного у фінальній версії. OpenAI стверджує, що GPT-4o чудово справляється зі складними інструкціями — модель може працювати з 10–20 об’єктами на сцені без помилок (інші ШІ зазвичай «спотикаються» вже на 5–8 об’єктах).
Звичайно, GPT-4o не ідеальна, і OpenAI це визнає. Іноді зображення обрізається знизу, залишаються проблеми з галюцинаціями, робота з більш ніж 10–20 об’єктами стає складною, а малювання тексту не на латиниці вимагає доопрацювання.