Компанія Apple спільно з Каліфорнійським університетом, представила інноваційну модель штучного інтелекту під назвою MGIE, що надала відкритий вихідний код для широкого кола користувачів. Ця технологія дає змогу редагувати фотографії з використанням текстових команд, написаних самим користувачем.
MGIE спирається на мультимодальні мовні моделі (MLLM), щоб досліджувати та інтерпретувати команди користувачів і ефективно виконувати їх. Цей інструмент надає можливість внесення як глобальних, так і локальних змін на зображенні. Наприклад, користувач може легко регулювати яскравість, контрастність, різкість, а також застосовувати художні ефекти.
З використанням MGIE можна трансформувати форму, розмір, колір або текстуру певних областей або об’єктів на фотографії. Також передбачені функції обрізки, зміни орієнтації, зміни розміру зображення і додавання фільтрів. Додаткові можливості включають зміну фону, додавання/видалення об’єктів і багато іншого.
Інструмент MGIE доступний для громадського використання на платформі GitHub, де представлений не тільки вихідний код, а й попередньо навчені моделі. Крім того, користувачі можуть випробувати MGIE на веб-сайті Hugging Face Spaces.
Після недавнього випуску PlayStation 5 Pro вже з'явилися припущення про наступну велику консоль Sony -…
Знаєте, з сучасними смартфонами постійна повна розрядка – це не просто зайве, а навіть шкідливо.…
Графічні прискорювачі розвиваються семимильними темпами, проте продуктивності навіть найпотужніших GPU не вистачає для забезпечення плавного…
Агентство Bloomberg повідомляє, що Apple тепер вважається банком у США завдяки технологіям Apple Pay і…
Google оголосила про поліпшення функції Android Switch, призначеної для перенесення даних між смартфонами. У 2025…
Авторитетний інсайдер і голова аналітичної фірми DSCC Росс Янг заявив, що наступного року Samsung випустить…