Рубріки: Новини

OpenAI випустила нову голосову модель і знизила ціни на 20%

Дмитро Сімагін

OpenAI представила велику мовну модель gpt-realtime, оптимізовану для генерації мовлення. Про це повідомляє блог компанії.

Новинка здатна відтворювати мовлення, яке звучить природніше, ніж усі попередні моделі. Наприклад, вона може змінювати інтонацію посеред речення.

До цього часу розробникам додатків OpenAI пропонувала лише попередню версію gpt-4o-realtime-preview. Вона дозволяла протестувати можливості, але для продакшн-сценаріїв мало підходила: були технічні обмеження та нестабільне ціноутворення.

Тепер розробники можуть використовуючи gpt-realtime в будь-яких програмах та налаштовувати її для конкретних завдань. Наприклад, команда, яка створює голосовий бот технічної підтримки, може доручити gpt-realtime цитувати інформацію з бази даних у відповідях на певні запити.

Доступ до gpt-realtime можна отримати через OpenAI Realtime API. Це інтерфейс прикладного програмування, який дозволяє клієнтам взаємодіяти з голосовими та мультимодальними моделями. В рамках оновлення продукту OpenAI зробила API загальнодоступним. 

Що стосується вартості, то ціни на аудіо-токени знижено на 20% в порівнянні з версією gpt-4o-realtime-preview:

  • $32 за 1 млн вхідних аудіо-токенів.
  • $64 за 1 млн вихідних токенів.
  • Для кешованих входів – $0.40 за 1 млн.

Останні статті

Ілон Маск анонсував конкурента Microsoft та Apple. Новий проект Macrohard матиме свою операційну систему

Ілон Маск припускає, що його новий проект Macrohard не обмежуватиметься розробкою програмного забезпечення, як Microsoft,…

15.10.2025

Фонд вільного програмного забезпечення почав розробку Librephone — «повністю безкоштовної» версії Android

Фонд вільного програмного забезпечення (Free Software Foundation, FSF) оголосив про запуск проекту Librephone, який має…

15.10.2025

Indeema придбала Perfsol, зміцнюючи свої позиції у штучному інтелекті та розробці інтелектуальних систем

Indeema, глобальна інженерна компанія зі спеціалізацією в галузі IoT, оголосила про придбання Perfsol — компанії-розробника…

15.10.2025

Є і буде завжди: як працювати з невизначеністю? Досвід у FAVBET Tech

Бізнес-аналітик – це фахівець, який перетворює запити замовника на конкретні вимоги до програмного забезпечення. Тому…

15.10.2025

Поліція затримала шахраїв, які використовували штучний інтелект для оформлення кредитів на українців

Слідчі ГСУ Національної поліції України за підтримки інших правоохоронних структур затримали учасників організованого злочинного угруповання,…

15.10.2025

Вразливість GitHub Copilot Chat дозволяла викрадали чужі ключі та інші конфіденційні дані

Дослідник безпеки Омер Майраз виявив критичну вразливість у GitHub Copilot Chat (CVSS 9.6). Вона дозволяла…

15.10.2025