В OpenAI розробили нову модель, яка прискорює генерацію мультимедіа в 50 разів
Спеціалісти компанії OpenAI Ченг Лу і Ян Сонг опублікували статтю, в якій описується новий тип моделі штучного інтелекту — моделі узгодженості безперервного часу (sCM). Як повідомляє Venture Beat, вона здатна прискорювати в 50 разів швидкість генерації мультимедіа: зображення, відео та аудіо.
Для порівняння: традиційні дифузійні моделі генерують зображення приблизно за 5 секунд, тоді як нова модель лише за 0.1 секунди. Якість зображення при цьому не втрачається.
Інновація OpenAI дозволяє моделям sCM генерувати мультимедіа лише за два етапи — це значно скорочує процес, оскільки попередні моделі на основі дифузії виконують для цього десятки та сотні послідовних кроків.
Дифузійні моделі забезпечують хороші результати в створенні реалістичних зображень, 3D-моделей, аудіо та відео, але вони менш придатні для використання в додатках, де вимагається створення мультимедіа в реальному часі. Теоретично нова технологія може стати основою для генерації зображень та відео практично моментально, без затримок у часі.
Міністерство цифрової трансформації України анонсує програму Veteran Venture Program від компанії SKELAR, яка надає шанс…
3 липня в Києві відбулися загальні збори Асоціації IT Ukraine. Це була закрита подія для…
Компанія Microsoft провела дослідження щодо того, на які професії найбільше вплине розвиток штучного інтелекту. Для…
Google розширює сферу застосування своєї LLM-моделі Gemini 2.5 Pro, додаючи агента для роботи в терміналі…
Чат-бот ChatGPT продовжує набирати популярність в усьому світі. Хоча цей інструмент штучного інтелекту поки поступається…
IT-галузь на порозі масштабної кризи і її першими жертвами стануть junior-фахівці. Однією з причин цього…