Рубріки: Новини

OpenAI випустила нову голосову модель і знизила ціни на 20%

Дмитро Сімагін

OpenAI представила велику мовну модель gpt-realtime, оптимізовану для генерації мовлення. Про це повідомляє блог компанії.

Новинка здатна відтворювати мовлення, яке звучить природніше, ніж усі попередні моделі. Наприклад, вона може змінювати інтонацію посеред речення.

До цього часу розробникам додатків OpenAI пропонувала лише попередню версію gpt-4o-realtime-preview. Вона дозволяла протестувати можливості, але для продакшн-сценаріїв мало підходила: були технічні обмеження та нестабільне ціноутворення.

Тепер розробники можуть використовуючи gpt-realtime в будь-яких програмах та налаштовувати її для конкретних завдань. Наприклад, команда, яка створює голосовий бот технічної підтримки, може доручити gpt-realtime цитувати інформацію з бази даних у відповідях на певні запити.

Доступ до gpt-realtime можна отримати через OpenAI Realtime API. Це інтерфейс прикладного програмування, який дозволяє клієнтам взаємодіяти з голосовими та мультимодальними моделями. В рамках оновлення продукту OpenAI зробила API загальнодоступним. 

Що стосується вартості, то ціни на аудіо-токени знижено на 20% в порівнянні з версією gpt-4o-realtime-preview:

  • $32 за 1 млн вхідних аудіо-токенів.
  • $64 за 1 млн вихідних токенів.
  • Для кешованих входів – $0.40 за 1 млн.

Останні статті

Агент Gemini CLI інтегровано в редактор коду Zed

Компанія Google оголосила про інтеграцію агента на базі штучного інтелекту Gemini CLI з редактором коду…

29.08.2025

Більшість проектів open source тримаються на одному розробнику

Більшість проектів з відкритим кодом тримаються на ентузіазмі одиночних розробників. Це стверджує Джош Брессерс, віце-президент…

29.08.2025

Anthropic буде навчати свої моделі на ваших чатах з Claude

Компанія Anthropic оголосила про зміни в політиці обробки даних: до 28 вересня всі користувачі інструмента…

29.08.2025

Код, згенерований senior-розробниками, потрапляє в продакшн у 2,5 рази частіше, ніж код джуніорів

Опитування, проведене хмарною платформою Fastly серед 791 розробника, виявило помітну різницю в тому, скільки коду,…

29.08.2025

Новий безкоштовний інструмент Microsoft створює 90-хвилинні подкасти з тексту

Компанія Microsoft представила новий проект з відкритим кодом VibeVoice, який перетворює текст на реалістичну мову…

28.08.2025

Google запускає локальну версію Gemini

Google оголосила про доступність для клієнтів локальної версії Gemini в рамках пропозиції Google Distributed Cloud…

28.08.2025