На Github появился бесплатный ИИ-инструмент Ecoute – он генерирует транскрипцию любого прямого эфира и быстро выдает ответы на только что озвученные вопросы.
На Github размещено видео, на котором включена симуляция собеседования. ИИ распознает язык, превращая его в текст и в отдельной вкладке генерирует ответ.
Соответственно, пользователь может зачитать ответ на тестовое задание своему потенциальному работодателю.
Если FFmpeg не установлен, сначала необходимо установить Chocolatey, менеджер пакетов для Windows. После этого – открыть PowerShell с правами админа и выполнить следующую команду:
Set-ExecutionPolicy Bypass -Scope Process -Force; [System.Net.ServicePointManager]::SecurityProtocol = [System.Net.ServicePointManager]::SecurityProtocol -bor 3072; iex ((New-Object System.Net.WebClient).DownloadString('https://community.chocolatey.org/install.ps1'))
После установки Chocolatey вы можете установить FFmpeg, выполнив следующую команду в PowerShell:
choco install ffmpeg-full
Убедитесь, что вы запускаете эти команды в окне PowerShell с правами администратора. Если при установке у вас возникнут проблемы, вы можете посетить официальные веб-сайты Chocolatey и FFmpeg для решения проблем.
Клонируйте репозиторий
git clone https://github.com/SevaSk/ecoute
Выделите ecoute
папку:
cd ecoute
Установите необходимые пакеты:
pip install -r requirements.txt
Создайте keys.py
файл и добавьте ключ OpenAI API:
echo 'OPENAI_API_KEY = "API KEY"' > keys.py
Замените API KEY
подлинным ключом OpenAI API.
Запустите основной сценарий:
python main.py
Теперь Ecoute начнет транскрибировать входящий сигнал с микрофона и динамика в режиме реального времени и предоставит предложенный ответ на основе разговора. Может потребоваться несколько секунд, чтобы разогреться, прежде чем транскрипция станет в режиме реального времени.
Несмотря на то, что Ecoute предоставляет транскрипцию в реальном времени и предлагает ответы, существует несколько известных ограничений его функциональности.
Ecoute настроен на прослушивание только микрофона и динамика по умолчанию в вашей системе. Он не обнаружит звук из других устройств или систем. Если вы хотите использовать другой микрофон или динамик, необходимо выбрать его как устройство по умолчанию в настройках.
Приложение использует «крошечную» версию модели Whisper ASR из-за низкого потребления ресурсов и быстрого отклика. Однако эта модель может быть не столь точной в транскрипции определенных типов речи, в частности ударений или необычных слов.
Модель Whisper, используемая в Ecoute, настроена на английский. Как следствие, она может неточно транскрибировать неанглийские языки или диалекты.
Отметим, недавно украинские разработчики создали ИИ-инструмент дубляжа на 70 языках.
Читайте также:
Projector запустил чат-бот, помогающий выбрать профессию в IT
Без СhatGPT и «попсы»: 12 инструментов ИИ и платформ, которые помогут найти работу в IT
Прокси (proxy), или прокси-сервер — это программа-посредник, которая обеспечивает соединение между пользователем и интернет-ресурсом. Принцип…
Согласитесь, было бы неплохо соединить в одно сайт и приложение для смартфона. Если вы еще…
Повсеместное распространение смартфонов привело к огромному спросу на мобильные игры и приложения. Миллиарды пользователей гаджетов…
В перечне популярных чат-ботов с искусственным интеллектом Google Bard (Gemini) еще не пользуется такой популярностью…
Скрипт (англ. — сценарий), — это небольшая программа, как правило, для веб-интерфейса, выполняющая определенную задачу.…
Дедлайн (от англ. deadline — «крайний срок») — это конечная дата стачи проекта или задачи…