Рубріки: Новини

В OpenAI розробили нову модель, яка прискорює генерацію мультимедіа в 50 разів

Дмитро Сімагін

Спеціалісти компанії OpenAI Ченг Лу і Ян Сонг опублікували статтю, в якій описується новий тип моделі штучного інтелекту — моделі узгодженості безперервного часу (sCM). Як повідомляє Venture Beat, вона здатна прискорювати в 50 разів швидкість генерації мультимедіа: зображення, відео та аудіо. 

Для порівняння: традиційні дифузійні моделі генерують зображення приблизно за 5 секунд, тоді як нова модель лише за 0.1 секунди. Якість зображення при цьому не втрачається.

Інновація OpenAI дозволяє моделям sCM генерувати мультимедіа лише за два етапи — це значно скорочує процес, оскільки попередні моделі на основі дифузії виконують для цього десятки та сотні послідовних кроків.

Дифузійні моделі забезпечують хороші результати в створенні реалістичних зображень, 3D-моделей, аудіо та відео, але вони менш придатні для використання в додатках, де вимагається створення мультимедіа в реальному часі. Теоретично нова технологія може стати основою для генерації зображень та відео практично моментально, без затримок у часі.

Останні статті

Telegram напише текст замість вас: у месенджері тестують ШІ-редактор

У бета-версії Telegram з'явився AI Editor — текстовий редактор на базі штучного інтелекту. Він може…

27.03.2026

OpenAI додає плагіни в інструмент кодування Codex

OpenAI додає в Codex плагіни, інтегровані з популярними інструментами, такими як Slack, Figma, Notion, Gmail…

27.03.2026

Google має внутрішній інструмент кодування Agent Smith. Він настільки популярний, що доступ до нього обмежили

Співробітники Google активно використовують новий внутрішній інструмент на базі штучного інтелекту під назвою Agent Smith.…

27.03.2026

Міноборони відкрило більше 2000 вакансій для IT-фахівців — Михайло Федоров

Міністр оборони України Михайло Федоров заявив про формування IT-вертикалі й відкриття понад 2000 вакансій для…

27.03.2026

Нова версія Swift 6.3 покращує сумісність з Android SDK та мовою програмування C

Компанія Apple представила Swift 6.3 — нову версію мови програмування для різних платформ, яка тепер…

27.03.2026

Gemini тепер може імпортувати ваші дані з інших чат-ботів

Google додає в Gemini два інструменти для міграції даних — нові віджети, розроблені для того,…

27.03.2026