Рубріки: Новости

Как программировать голосом

Богдан Мирченко

Голосовое программирование может стать новым этапом разработки ПО. С помощью платформ голосового управления программисты произносят команды для манипулирования и написания кода, а так же для автоматизации рабочих процессов.

Две ведущие платформы речевого программирования — Serenade и Talon — разрабатывались из-за необходимости их авторов оставить профессию в связи с болями в руках. Их целью стало создание платформы, которая полностью заменит клавиатуру и мышь.

Приложение для кодирования голоса Serenade имеет механизм преобразования речи в текст, разработанный специально для кода, в отличие от API преобразования речи в текст от Google, который предназначен для разговорной речи. Когда инженер-программист произносит код, движок Serenade передает его на свой уровень обработки естественного языка. Программа заботится о синтаксисе, включая служебное слово def, круглые скобки и двоеточие, обеспечивая более естественный способ озвучивания кода.

По словам создателя платформы Talon, в ней есть несколько компонентов: распознавание речи, отслеживание взгляда и распознавание шума. Вместо того чтобы заставлять писать слова по буквам, в Talon есть команда для записи полных слов, фраз и предложений.

Механизм распознавания речи Talon основан на системе автоматического распознавания речи Wav2letter от Facebook. Отслеживание взгляда и распознавание шума имитируют навигацию с помощью мыши, перемещение курсора по экрану в зависимости от движения глаз и выполнение щелчков при щелчке во рту.

Ниже приведен пример — пошаговое руководство в Serenade и Talon по генерации кода Python, необходимого для вывода на экран слова «hello».

Генерация кода Python голосовыми командами

Платформы голосового кодирования с открытым исходным кодом, такие как Aenea и Caster, бесплатны, но обе основаны на движке распознавания речи Dragon, который нужно покупать отдельно. А чтобы попробовать голосовое кодирование, вам потребуется качественный микрофон, особенно если вы хотите устранить фоновый шум и оборудование для отслеживания взгляда.

Останні статті

Что такое прокси-сервер: пояснение простыми словами, зачем нужны прокси

Прокси (proxy), или прокси-сервер — это программа-посредник, которая обеспечивает соединение между пользователем и интернет-ресурсом. Принцип…

21.11.2024

Что такое PWA приложение? Зачем необходимо прогрессивное веб-приложение

Согласитесь, было бы неплохо соединить в одно сайт и приложение для смартфона. Если вы еще…

19.11.2024

Как создать игру на телефоне: программирование с помощью конструктора

Повсеместное распространение смартфонов привело к огромному спросу на мобильные игры и приложения. Миллиарды пользователей гаджетов…

17.11.2024

Google Bard: эффективный аналог ChatGPT

В перечне популярных чат-ботов с искусственным интеллектом Google Bard (Gemini) еще не пользуется такой популярностью…

14.11.2024

Скрипт и программирование: что это такое простыми словами

Скрипт (англ. — сценарий), — это небольшая программа, как правило, для веб-интерфейса, выполняющая определенную задачу.…

12.11.2024

Дедлайн в разработке: что это такое простыми словами

Дедлайн (от англ. deadline — «крайний срок») — это конечная дата стачи проекта или задачи…

11.11.2024