OpenAI додала в ChatGPT нову функцію генерації зображень на базі GPT-4o
Компанія OpenAI представила нову вбудовану в ChatGPT функцію генерації зображень під назвою 4o Image Generation. На відміну від DALL-E 3, вона набагато краще розуміє контекст, чітко обробляє складні інструкції, правильно пов’язує атрибути з об’єктами і вміє генерувати текст прямо на зображеннях, пише Venture Beat.
4o Image Generation доступна для всіх користувачів, включно з тими, хто працює з ChatGPT безкоштовно: вони мають ліміт до трьох зображень на день.
Головна відмінність нової системи в тому, що вона генерує зображення поступово — зліва направо та зверху вниз, що дозволяє більш точно контролювати деталі, особливо під час роботи з написами та множинними об’єктами.
Наприклад, якщо задати сцену з десятком різних фігур і кольорів, GPT-4o впорається без помилок, тоді як інші моделі починають плутатися вже п’ятому-шостому елементі. Також покращилася робота з прозорим тлом, що робить модель особливо корисною для генерації логотипів, стікерів та елементів інтерфейсу.
Ще однією новинкою є можливість редагувати вже завантажені зображення. Користувач може попросити додати об’єкт на фото або прибрати непотрібний елемент, і система коректно виконає завдання текстового опису.
OpenAI окремо наголошує на заходах безпеки 4o Image Generation. Всі зображення маркуються метаданими C2PA, що вказують на їхнє походження. Функція відмовляє у генерації дипфейків, сцен із насильством та інших чутливих тем.
Сообщить об опечатке
Текст, который будет отправлен нашим редакторам: