OpenAI представила генерацію зображень у моделі GPT-4o з покращеною якістю тексту

Реклама

ЗАРАЗ ЧИТАЮТЬ

Час читання: < 1 хв.

Модель штучного інтелекту GPT-4o, яка вийшла рік тому, отримала нові функції, зокрема генерацію зображень. Тепер ШІ може створювати детальні зображення за текстовими інструкціями і коригувати їх до тих пір, поки результат повністю не відповідатиме вашим уявленням.

Процес зазвичай починається з запиту, а потім ви можете вносити корективи. GPT-4o працює по-іншому: ви даєте перший запит, потім додаєте уточнення, поки не отримаєте ідеальний результат.

Реклама

OpenAI вибирала кращі приклади — багато зображень були відзначені як «найкращі з 2» або «найкращі з 8». Інтерфейс простий, а результат чудовий.

GPT-4o може створювати зображення з нуля або змінювати вже готові. Наприклад, користувач завантажив фото кота і попросив додати йому капелюх детектива та монокль, а потім уточнив деталі, перетворивши картинку на сцену з гри.

OpenAI 4o Image Generation

Можна використовувати одразу кілька зображень та комбінувати елементи з кожного у фінальній версії. OpenAI стверджує, що GPT-4o чудово справляється зі складними інструкціями — модель може працювати з 10–20 об’єктами на сцені без помилок (інші ШІ зазвичай «спотикаються» вже на 5–8 об’єктах).

Character Consistency with 4o Image Generation

Звичайно, GPT-4o не ідеальна, і OpenAI це визнає. Іноді зображення обрізається знизу, залишаються проблеми з галюцинаціями, робота з більш ніж 10–20 об’єктами стає складною, а малювання тексту не на латиниці вимагає доопрацювання.

Реклама

Вас також можуть зацікавити новини:

Не пропустіть

СВІЖІ НОВИНИ