OpenAI випустила Sora 2 — найбільш потужний інструмент генерації відео та аудіо
Після 10 місяців роботи OpenAI представила Sora 2 — найпотужнішу на сьогодні модель генерації відео та аудіо. Як запевняє компанія-розробник, Sora 2 є «моментом GPT-3.5» у відеогенерації. Новинка здатна створювати складні сцени з урахуванням законів фізики так, як це було неможливо попереднім моделям, пише Neowin.
Sora 2 набагато краще розуміє фізичну динаміку, на відміну від попередніх систем генеративного штучного інтелекту, які часто спотворювали реальність. Модель може генерувати складні рухи, такі як гімнастичні сальто назад, зберігаючи при цьому синхронізовані діалоги між персонажами та звукові ефекти.
Одна з ключових переваг Sora 2 — це керованість. Модель здатна виконувати детальні інструкції для кількох кадрів та підтримувати стабільний стан світу протягом усієї послідовності кадрів. Вона також підтримує різні візуальні стилі, включаючи реалістичну, кінематографічну та аніме.
Ще однією з цікавих функцій Sora 2 є можливість додавати елементи реального світу у згенеровані відео за допомогою «камео». Завантажуючи короткий відео- та аудіозразок, користувачі можуть вставляти точні цифрові зображення себе, друзів чи об’єктів у будь-яке згенероване середовище.
Мобільний додаток Sora вже доступний для завантаження на iOS, але поки лише за запрошенням. Користувачі тарифу ChatGPT Pro вартістю $200 на місяць можуть отримати доступ до більш якісної моделі Sora 2 Pro разом з існуючою моделлю Sora 1 Turbo. OpenAI стверджує, що модель також незабаром буде доступна через API.
Компанія Google оголосила про запуск Agent Development Kit (ADK), спеціально розробленого для мови програмування Java.…
Керівництво Європейського Союзу офіційно заявило про необхідність негайного зниження попиту на пальне. Для цього треба…
Компанія Google офіційно оголосила про впровадження обов’язкової підтримки 64-бітних архітектур для всіх застосунків платформи Wear…
Сьогодні більшість нових систем створюються з використанням контейнерів та хмарної інфраструктури. Але в реальному корпоративному…
Дослідники компанії Meta розробили новий підхід до використання великих мовних моделей (LLM) для аналізу програмного…
Нове дослідження від Google DeepMind попереджає: поки ми навчаємось працювати з автономними ШІ-агентами, які здатні…