xAI запускає Custom Voices — миттєве клонування голосу для Grok
Компанія xAI представила функцію Custom Voices, яка дозволяє користувачам створювати ідентичну цифрову копію свого голосу. Це не просто черговий інструмент для озвучення тексту — це спроба зробити взаємодію з ШІ максимально персоналізованою.

Як це працює?
Процес створення неймовірно швидкий і не потребує студійного обладнання:
- Час запису: Вам потрібно лише близько 60–120 секунд природного мовлення.
- Швидкість обробки: Високоякісна модель голосу готова менш ніж за 2 хвилини.
- Інтеграція: Створений голос можна миттєво використовувати в API для перетворення тексту в мовлення (TTS) або у голосових агентах Grok.
Безпека понад усе (чи майже)
Щоб ваш голос не “вкрали” з випадкового запису в інтернеті, xAI впровадили двоетапну верифікацію:
- Жива фраза: Користувач має прочитати спеціальну фразу-пароль у реальному часі. Система розпізнавання мовлення (STT) перевіряє, чи ви це дійсно ви.
- Біометричне порівняння: ШІ порівнює характеристики голосу (embeddings) з парольної фрази та основного запису. Це робить практично неможливим використання заздалегідь підготовлених аудіофайлів інших людей.
Важливо: Наразі функція доступна переважно в США (за винятком штату Іллінойс через суворі закони щодо біометрії).
Паралельно консоль xAI отримала оновлену Voice Library — бібліотеку з понад 80 попередньо встановленими голосами, що охоплюють 28 мов. Використання клонованих голосів не передбачає додаткової оплати.
Функція Custom Voices побудована на базі нещодавно запущених API Grok Speech-to-Text і Text-to-Speech, а також голосової агентної моделі Grok Voice Think Fast 1.0. За словами xAI, ця модель вже застосовується в системі клієнтської підтримки та продажів Starlink.
Нагадаємо: не так давно топ-менеджер xAI запевнив підлеглих, що звільнень більше не буде, і потім звільнив ще 100 фахівців.
Підписуйтесь на нас у соцмережах: Telegram | Facebook | LinkedIn












Сообщить об опечатке
Текст, который будет отправлен нашим редакторам: