OpenAI додала в ChatGPT нову функцію генерації зображень на базі GPT-4o
Компанія OpenAI представила нову вбудовану в ChatGPT функцію генерації зображень під назвою 4o Image Generation. На відміну від DALL-E 3, вона набагато краще розуміє контекст, чітко обробляє складні інструкції, правильно пов’язує атрибути з об’єктами і вміє генерувати текст прямо на зображеннях, пише Venture Beat.
4o Image Generation доступна для всіх користувачів, включно з тими, хто працює з ChatGPT безкоштовно: вони мають ліміт до трьох зображень на день.
Головна відмінність нової системи в тому, що вона генерує зображення поступово — зліва направо та зверху вниз, що дозволяє більш точно контролювати деталі, особливо під час роботи з написами та множинними об’єктами.
Наприклад, якщо задати сцену з десятком різних фігур і кольорів, GPT-4o впорається без помилок, тоді як інші моделі починають плутатися вже п’ятому-шостому елементі. Також покращилася робота з прозорим тлом, що робить модель особливо корисною для генерації логотипів, стікерів та елементів інтерфейсу.
Ще однією новинкою є можливість редагувати вже завантажені зображення. Користувач може попросити додати об’єкт на фото або прибрати непотрібний елемент, і система коректно виконає завдання текстового опису.
OpenAI окремо наголошує на заходах безпеки 4o Image Generation. Всі зображення маркуються метаданими C2PA, що вказують на їхнє походження. Функція відмовляє у генерації дипфейків, сцен із насильством та інших чутливих тем.
Українські технологічні проєкти мають шанс заявити про себе на світовій арені. Відкрито прийом заявок на…
Корпорація Microsoft пропонує частині своїх досвідчених співробітників у США залишити посаду добровільно, запроваджуючи програму викупу…
Китайська компанія DeepSeek представила свій новий флагман — LLM-модель DeepSeek-V4. Рівно через рік після свого…
Китайський технологічний гігант Alibaba оголосив про масштабне розширення своєї присутності на ринку електроавтомобілів. Велика мовна…
Компанія Microsoft розширює застосування концепції під назвою Vibe Working (вайб-воркінг) та спеціального режиму роботи Agent…
Компанія OpenAI представила GPT-5.5 — нову LLM-модель, орієнтовану на виконання складних багатоетапних завдань з мінімальним…