Рубріки: Новини

В OpenAI розробили нову модель, яка прискорює генерацію мультимедіа в 50 разів

Дмитро Сімагін

24.10.2024 15:35

Спеціалісти компанії OpenAI Ченг Лу і Ян Сонг опублікували статтю, в якій описується новий тип моделі штучного інтелекту — моделі узгодженості безперервного часу (sCM). Як повідомляє Venture Beat, вона здатна прискорювати в 50 разів швидкість генерації мультимедіа: зображення, відео та аудіо.

Для порівняння: традиційні дифузійні моделі генерують зображення приблизно за 5 секунд, тоді як нова модель лише за 0.1 секунди. Якість зображення при цьому не втрачається.

Інновація OpenAI дозволяє моделям sCM генерувати мультимедіа лише за два етапи — це значно скорочує процес, оскільки попередні моделі на основі дифузії виконують для цього десятки та сотні послідовних кроків.

Дифузійні моделі забезпечують хороші результати в створенні реалістичних зображень, 3D-моделей, аудіо та відео, але вони менш придатні для використання в додатках, де вимагається створення мультимедіа в реальному часі. Теоретично нова технологія може стати основою для генерації зображень та відео практично моментально, без затримок у часі.

Наступна стаття Чат-бот Anthropic Claude тепер вміє писати та запускати JavaScript-код »

попередня стаття « Український розробник в середньому надсилає 10 відгуків для отримання оферу

Дмитро Сімагін

Теги: openAIштучний інтелект

24.10.2024 15:35

Останні статті

Новини

Telegram напише текст замість вас: у месенджері тестують ШІ-редактор

У бета-версії Telegram з'явився AI Editor — текстовий редактор на базі штучного інтелекту. Він може…

27.03.2026

Новини

OpenAI додає плагіни в інструмент кодування Codex

OpenAI додає в Codex плагіни, інтегровані з популярними інструментами, такими як Slack, Figma, Notion, Gmail…

27.03.2026

Новини

Google має внутрішній інструмент кодування Agent Smith. Він настільки популярний, що доступ до нього обмежили

Співробітники Google активно використовують новий внутрішній інструмент на базі штучного інтелекту під назвою Agent Smith.…

27.03.2026

Новини

Міноборони відкрило більше 2000 вакансій для IT-фахівців — Михайло Федоров

Міністр оборони України Михайло Федоров заявив про формування IT-вертикалі й відкриття понад 2000 вакансій для…

27.03.2026

Новини

Нова версія Swift 6.3 покращує сумісність з Android SDK та мовою програмування C

Компанія Apple представила Swift 6.3 — нову версію мови програмування для різних платформ, яка тепер…

27.03.2026

Новини

Gemini тепер може імпортувати ваші дані з інших чат-ботів

Google додає в Gemini два інструменти для міграції даних — нові віджети, розроблені для того,…

27.03.2026

В OpenAI розробили нову модель, яка прискорює генерацію мультимедіа в 50 разів

Схожі статті

Останні статті

Telegram напише текст замість вас: у месенджері тестують ШІ-редактор

OpenAI додає плагіни в інструмент кодування Codex

Google має внутрішній інструмент кодування Agent Smith. Він настільки популярний, що доступ до нього обмежили

Міноборони відкрило більше 2000 вакансій для IT-фахівців — Михайло Федоров

Нова версія Swift 6.3 покращує сумісність з Android SDK та мовою програмування C

Gemini тепер може імпортувати ваші дані з інших чат-ботів