Рубріки: Новини

Це читерство в реалі: з’явився безплатний ШІ-інструмент для співбесід та іспитів

Ігор Шелудченко

На Github з’явився безплатний ШІ-інструмент Ecoute — він генерує транскрипцію будь-якого прямого ефіру і швидко видає відповіді на щойно озвучені питання.

На Github розміщено відео, на якому включена симуляція співбесіди. ШІ розпізнає мову, перетворюючи її в текст та в окремій вкладці генерує відповідь.

Відповідно, користувач може зачитати відповідь на тестове завдання своєму потенційному роботодавцю.

Що потрібно для Ecoute

  • Python 3.x
  • Ключ OpenAI API
  • ОС Windows (не перевірено на інших операційних систем)
  • FFmpeg

Якщо FFmpeg не інстальовано, то спочатку потрібно встановити Chocolatey, менеджер пакетів для Windows. Після цього — відкрити PowerShell з правами адміна і виконат таку команду:

Set-ExecutionPolicy Bypass -Scope Process -Force; [System.Net.ServicePointManager]::SecurityProtocol = [System.Net.ServicePointManager]::SecurityProtocol -bor 3072; iex ((New-Object System.Net.WebClient).DownloadString('https://community.chocolatey.org/install.ps1'))

Після встановлення Chocolatey ви можете встановити FFmpeg, виконавши таку команду в PowerShell:

choco install ffmpeg-full

Переконайтеся, що ви запускаєте ці команди у вікні PowerShell з правами адміністратора. Якщо під час інсталяції у вас виникнуть проблеми, ви можете відвідати офіційні веб-сайти Chocolatey і FFmpeg для вирішення проблем.

Встановлення

Клонуйте репозиторій

git clone https://github.com/SevaSk/ecoute

Перейдіть до ecouteпапки:

cd ecoute

Встановіть необхідні пакети:

pip install -r requirements.txt

Створіть keys.pyфайл і додайте ключ OpenAI API:

echo 'OPENAI_API_KEY = "API KEY"' > keys.py

Замініть API KEYсправжнім ключем OpenAI API.

Запуск Ecoute

Запустіть основний сценарій:

python main.py

Тепер Ecoute почне транскрибувати вхідний сигнал із мікрофона та динаміка в режимі реального часу та надасть запропоновану відповідь на основі розмови. Може знадобитися кілька секунд, щоб розігрітися, перш ніж транскрипція стане в режимі реального часу.

Обмеження

Незважаючи на те, що Ecoute надає транскрипцію в реальному часі та пропонує відповіді, є кілька відомих обмежень його функціональності.

Мікрофон і динамік за замовчуванням

Ecoute наразі налаштовано на прослуховування лише мікрофона та динаміка за замовчуванням у вашій системі. Він не виявить звук з інших пристроїв або систем. Якщо ви хочете використовувати інший мікрофон або динамік, вам потрібно буде обрати його як пристрій за замовчанням у налаштуваннях.

Модель Whisper

Застосунок використовує «крихітну» версію моделі Whisper ASR через низьке споживання ресурсів і швидкий час відгуку. Однак ця модель може бути не такою точною у транскрипції певних типів мовлення, зокрема наголосів або незвичайних слів.

Мова

Модель Whisper, яка використовується в Ecoute, налаштована на англійську. Як наслідок, вона може неточно транскрибувати неанглійські мови чи діалекти.

Зазначимо, нещодавно українські розробники створили ШІ-інструмент дубляжу 70 мовами.

Читайте також:

Projector запустив чат-бот, який допомагає обрати професію в IT

Без СhatGPT та «попси»: 12 інструментів ШІ та платформ, що допоможуть знайти роботу в IT

Google запустить ШІ для кодування: він працюватиме на новій моделі PaLM 2 та розумітиме українську

Останні статті

Оновлення Telegram: з’явились повідомлення адмінам каналів і скорочення голосових повідомлень

Команда Telegram випустила чергове велике оновлення. Адмінам каналів тепер можна надсилати особисті повідомлення, спростилося перемикання…

04.06.2025

У Росії націоналізували одну з найбільших геймдев-компаній. Звинуватили в підтримці ЗСУ

Таганський суд Москви ухвалив рішення про передачу у власність держави 100% уставного капіталу IT-компанії «Леста…

04.06.2025

Adobe випустила бета-версію Photoshop для Android

Компанія Adobe оголосила про випуск бета-версії мобільного додатку Photoshop для платформи Android. Реліз стався через…

03.06.2025

Користувачам Windows дозволять видалили Microsoft Store і перестануть нав’язувати Edge — але не всім

Microsoft оголосила, що внесе у Windows деякі зміни щодо роботи сторонніх додатків та сервісів. Компанія…

03.06.2025

Salesforce скорочує найм програмістів. Причина в штучному інтелекті

Завдяки інструментам на базі штучного інтелекту американський IT-гігант Salesforce скоротив найм технічних працівників, у тому…

03.06.2025

OpenAI переписує інструмент кодування Codex CLI з TypeScript на Rust

OpenAI переписала свій інструмент кодування Codex CLI з TypeScript на Rust. Причиною названо підвищення продуктивності…

03.06.2025