OpenAI додала в ChatGPT нову функцію генерації зображень на базі GPT-4o
Компанія OpenAI представила нову вбудовану в ChatGPT функцію генерації зображень під назвою 4o Image Generation. На відміну від DALL-E 3, вона набагато краще розуміє контекст, чітко обробляє складні інструкції, правильно пов’язує атрибути з об’єктами і вміє генерувати текст прямо на зображеннях, пише Venture Beat.
4o Image Generation доступна для всіх користувачів, включно з тими, хто працює з ChatGPT безкоштовно: вони мають ліміт до трьох зображень на день.
Головна відмінність нової системи в тому, що вона генерує зображення поступово — зліва направо та зверху вниз, що дозволяє більш точно контролювати деталі, особливо під час роботи з написами та множинними об’єктами.
Наприклад, якщо задати сцену з десятком різних фігур і кольорів, GPT-4o впорається без помилок, тоді як інші моделі починають плутатися вже п’ятому-шостому елементі. Також покращилася робота з прозорим тлом, що робить модель особливо корисною для генерації логотипів, стікерів та елементів інтерфейсу.
Ще однією новинкою є можливість редагувати вже завантажені зображення. Користувач може попросити додати об’єкт на фото або прибрати непотрібний елемент, і система коректно виконає завдання текстового опису.
OpenAI окремо наголошує на заходах безпеки 4o Image Generation. Всі зображення маркуються метаданими C2PA, що вказують на їхнє походження. Функція відмовляє у генерації дипфейків, сцен із насильством та інших чутливих тем.
Adobe інтегрувала ChatGPT у програми Photoshop, Acrobat і Adobe Express. Користувачі тепер можуть створювати дизайни…
В оновленні коду майбутньої версії Linux 6.19 видалено функцію під назвою d_genocide(). Вона була пов'язана…
Компанія JetBrains закриває Fleet — полегшене IDE нового покоління, яке розвивали паралельно з IntelliJ IDEA.…
Учасники конференції Maintainers Summit визнали успішним експеримент з додавання в ядро Linux можливості розробки компонентів…
Французький стартап Mistral представив нове покоління своєї LLM-моделі, яка доступна в двох варіантах: Devstral 2…
Китайські LLM-моделі з відкритим кодом стрімко завойовують світовий ринок штучного інтелекту, зайнявши майже третину глобального…