OpenAI випустила Sora 2 — найбільш потужний інструмент генерації відео та аудіо
Після 10 місяців роботи OpenAI представила Sora 2 — найпотужнішу на сьогодні модель генерації відео та аудіо. Як запевняє компанія-розробник, Sora 2 є «моментом GPT-3.5» у відеогенерації. Новинка здатна створювати складні сцени з урахуванням законів фізики так, як це було неможливо попереднім моделям, пише Neowin.
Sora 2 набагато краще розуміє фізичну динаміку, на відміну від попередніх систем генеративного штучного інтелекту, які часто спотворювали реальність. Модель може генерувати складні рухи, такі як гімнастичні сальто назад, зберігаючи при цьому синхронізовані діалоги між персонажами та звукові ефекти.
Одна з ключових переваг Sora 2 — це керованість. Модель здатна виконувати детальні інструкції для кількох кадрів та підтримувати стабільний стан світу протягом усієї послідовності кадрів. Вона також підтримує різні візуальні стилі, включаючи реалістичну, кінематографічну та аніме.
Ще однією з цікавих функцій Sora 2 є можливість додавати елементи реального світу у згенеровані відео за допомогою «камео». Завантажуючи короткий відео- та аудіозразок, користувачі можуть вставляти точні цифрові зображення себе, друзів чи об’єктів у будь-яке згенероване середовище.
Мобільний додаток Sora вже доступний для завантаження на iOS, але поки лише за запрошенням. Користувачі тарифу ChatGPT Pro вартістю $200 на місяць можуть отримати доступ до більш якісної моделі Sora 2 Pro разом з існуючою моделлю Sora 1 Turbo. OpenAI стверджує, що модель також незабаром буде доступна через API.
Сообщить об опечатке
Текст, который будет отправлен нашим редакторам: