Рубріки: Новини

OpenAI випустила Sora 2 — найбільш потужний інструмент генерації відео та аудіо

Дмитро Сімагін

Після 10 місяців роботи OpenAI представила Sora 2 — найпотужнішу на сьогодні модель генерації відео та аудіо. Як запевняє компанія-розробник, Sora 2 є «моментом GPT-3.5» у відеогенерації. Новинка здатна створювати складні сцени з урахуванням законів фізики так, як це було неможливо попереднім моделям, пише Neowin.

Sora 2 набагато краще розуміє фізичну динаміку, на відміну від попередніх систем генеративного штучного інтелекту, які часто спотворювали реальність. Модель може генерувати складні рухи, такі як гімнастичні сальто назад, зберігаючи при цьому синхронізовані діалоги між персонажами та звукові ефекти.

Одна з ключових переваг Sora 2 — це керованість. Модель здатна виконувати детальні інструкції для кількох кадрів та підтримувати стабільний стан світу протягом усієї послідовності кадрів. Вона також підтримує різні візуальні стилі, включаючи реалістичну, кінематографічну та аніме.

Ще однією з цікавих функцій Sora 2 є можливість додавати елементи реального світу у згенеровані відео за допомогою «камео». Завантажуючи короткий відео- та аудіозразок, користувачі можуть вставляти точні цифрові зображення себе, друзів чи об’єктів у будь-яке згенероване середовище.

Мобільний додаток Sora вже доступний для завантаження на iOS, але поки лише за запрошенням. Користувачі тарифу ChatGPT Pro вартістю $200 на місяць можуть отримати доступ до більш якісної моделі Sora 2 Pro разом з існуючою моделлю Sora 1 Turbo. OpenAI стверджує, що модель також незабаром буде доступна через API.

Останні статті

Дефіцит оперативної пам’яті погіршується: «один із типів DRAM подорожчав на 75% лише за місяць»

Зростання цін на оперативну пам'ять починає нагадувати гіперінфляцію часів Веймарської республіки. За твердженням Bloomberg, один…

16.02.2026

Ілон Маск звинуватив філософа, який навчає LLM Claude, у відсутності дітей

Ілон Маск розкритикував жінку-філософа Аманду Аскелл, яка в компанії Anthropic відповідає на навчання LLM-моделей серії…

16.02.2026

Google оновлює розширення Conductor для Gemini CLI. Тепер воно автоматично аналізує якість вашого коду

Conductor, представлений Google в грудні як розширення для Gemini CLI, отримав перше оновлення. Тепер інструмент…

16.02.2026

Студенти більше не хочуть вчитись на факультетах інформатики. Але не проти вивчати штучний інтелект

Випускники американських шкіл, які будують плани на майбутнє, все частіше відмовляються від вступу на факультети…

16.02.2026

Ажіотаж навколо агента OpenClaw спровокував дефіцит комп’ютерів Mac: черги до 6 тижнів

Популярність локального агента з відкритим кодом OpenClaw (раніше відомий як Clawbot, Moltbot) спричинила справжню лихоманку…

16.02.2026

Google Docs тепер може стисло переказати ваш текст голосом

Після запуску перетворення тексту в мовлення, яке відкрили користувачам у серпні минулого року, популярний сервіс…

13.02.2026