Рубріки: Новини

Це читерство в реалі: з’явився безплатний ШІ-інструмент для співбесід та іспитів

Ігор Шелудченко

На Github з’явився безплатний ШІ-інструмент Ecoute — він генерує транскрипцію будь-якого прямого ефіру і швидко видає відповіді на щойно озвучені питання.

На Github розміщено відео, на якому включена симуляція співбесіди. ШІ розпізнає мову, перетворюючи її в текст та в окремій вкладці генерує відповідь.

Відповідно, користувач може зачитати відповідь на тестове завдання своєму потенційному роботодавцю.

Що потрібно для Ecoute

  • Python 3.x
  • Ключ OpenAI API
  • ОС Windows (не перевірено на інших операційних систем)
  • FFmpeg

Якщо FFmpeg не інстальовано, то спочатку потрібно встановити Chocolatey, менеджер пакетів для Windows. Після цього — відкрити PowerShell з правами адміна і виконат таку команду:

Set-ExecutionPolicy Bypass -Scope Process -Force; [System.Net.ServicePointManager]::SecurityProtocol = [System.Net.ServicePointManager]::SecurityProtocol -bor 3072; iex ((New-Object System.Net.WebClient).DownloadString('https://community.chocolatey.org/install.ps1'))

Після встановлення Chocolatey ви можете встановити FFmpeg, виконавши таку команду в PowerShell:

choco install ffmpeg-full

Переконайтеся, що ви запускаєте ці команди у вікні PowerShell з правами адміністратора. Якщо під час інсталяції у вас виникнуть проблеми, ви можете відвідати офіційні веб-сайти Chocolatey і FFmpeg для вирішення проблем.

Встановлення

Клонуйте репозиторій

git clone https://github.com/SevaSk/ecoute

Перейдіть до ecouteпапки:

cd ecoute

Встановіть необхідні пакети:

pip install -r requirements.txt

Створіть keys.pyфайл і додайте ключ OpenAI API:

echo 'OPENAI_API_KEY = "API KEY"' > keys.py

Замініть API KEYсправжнім ключем OpenAI API.

Запуск Ecoute

Запустіть основний сценарій:

python main.py

Тепер Ecoute почне транскрибувати вхідний сигнал із мікрофона та динаміка в режимі реального часу та надасть запропоновану відповідь на основі розмови. Може знадобитися кілька секунд, щоб розігрітися, перш ніж транскрипція стане в режимі реального часу.

Обмеження

Незважаючи на те, що Ecoute надає транскрипцію в реальному часі та пропонує відповіді, є кілька відомих обмежень його функціональності.

Мікрофон і динамік за замовчуванням

Ecoute наразі налаштовано на прослуховування лише мікрофона та динаміка за замовчуванням у вашій системі. Він не виявить звук з інших пристроїв або систем. Якщо ви хочете використовувати інший мікрофон або динамік, вам потрібно буде обрати його як пристрій за замовчанням у налаштуваннях.

Модель Whisper

Застосунок використовує «крихітну» версію моделі Whisper ASR через низьке споживання ресурсів і швидкий час відгуку. Однак ця модель може бути не такою точною у транскрипції певних типів мовлення, зокрема наголосів або незвичайних слів.

Мова

Модель Whisper, яка використовується в Ecoute, налаштована на англійську. Як наслідок, вона може неточно транскрибувати неанглійські мови чи діалекти.

Зазначимо, нещодавно українські розробники створили ШІ-інструмент дубляжу 70 мовами.

Читайте також:

Projector запустив чат-бот, який допомагає обрати професію в IT

Без СhatGPT та «попси»: 12 інструментів ШІ та платформ, що допоможуть знайти роботу в IT

Google запустить ШІ для кодування: він працюватиме на новій моделі PaLM 2 та розумітиме українську

Останні статті

Більше 8 млрд грн податків. Стільки сплатили резиденти Дія.City в І кварталі 2025 року

Резиденти Дія.City сплатили до бюджету понад 8 млрд грн податків в І кварталі 2025 року.…

18.04.2025

Китайських офісних працівників закликають менше працювати. Це має допомогти місцевій економіці

У Китаї закликають офісних працівників не працювати надто багато — держава сподівається, що вільний час…

18.04.2025

ChatGPT значно покращив пошук місць по фото. Це посилює проблеми конфіденційності

Експерти звертають увагу на тривожну тенденцію: люди все частіше використовують ChatGPT, щоб визначити місцезнаходження, зображене…

18.04.2025

Середовище розробки IntelliJ IDEA оновлено до версії 2025.1

Компанія JetBrains випустила нову версію мультимовного середовища розробки IntelliJ IDEA 2025.1. Оновлена IDE отримала численні…

18.04.2025

Discord впроваджує функцію сканування обличчя для перевірки віку користувачів

Платформа обміну миттєвими повідомленнями Discord впроваджує функцію перевірки віку за допомогою сканування обличчя. Зараз вона…

18.04.2025

Wikipedia випустила спеціальний датасет, щоб відволікти увагу ботів

Wikipedia намагається захистити себе від тисяч різноманітних ботів-скрейперів, які сканують дані цієї платформи для навчання…

18.04.2025