Рубріки: Новости

Как программировать голосом

Богдан Мирченко

Голосовое программирование может стать новым этапом разработки ПО. С помощью платформ голосового управления программисты произносят команды для манипулирования и написания кода, а так же для автоматизации рабочих процессов.

Две ведущие платформы речевого программирования — Serenade и Talon — разрабатывались из-за необходимости их авторов оставить профессию в связи с болями в руках. Их целью стало создание платформы, которая полностью заменит клавиатуру и мышь.

Приложение для кодирования голоса Serenade имеет механизм преобразования речи в текст, разработанный специально для кода, в отличие от API преобразования речи в текст от Google, который предназначен для разговорной речи. Когда инженер-программист произносит код, движок Serenade передает его на свой уровень обработки естественного языка. Программа заботится о синтаксисе, включая служебное слово def, круглые скобки и двоеточие, обеспечивая более естественный способ озвучивания кода.

По словам создателя платформы Talon, в ней есть несколько компонентов: распознавание речи, отслеживание взгляда и распознавание шума. Вместо того чтобы заставлять писать слова по буквам, в Talon есть команда для записи полных слов, фраз и предложений.

Механизм распознавания речи Talon основан на системе автоматического распознавания речи Wav2letter от Facebook. Отслеживание взгляда и распознавание шума имитируют навигацию с помощью мыши, перемещение курсора по экрану в зависимости от движения глаз и выполнение щелчков при щелчке во рту.

Ниже приведен пример — пошаговое руководство в Serenade и Talon по генерации кода Python, необходимого для вывода на экран слова «hello».

Генерация кода Python голосовыми командами

Платформы голосового кодирования с открытым исходным кодом, такие как Aenea и Caster, бесплатны, но обе основаны на движке распознавания речи Dragon, который нужно покупать отдельно. А чтобы попробовать голосовое кодирование, вам потребуется качественный микрофон, особенно если вы хотите устранить фоновый шум и оборудование для отслеживания взгляда.

Останні статті

Всегда перед глазами: 15 лучших тем VS Code на 2026 год

Visual Code от Microsoft, вероятно, один из самых популярных редакторов кода. Разработчики любят его за…

22.02.2026

Киберпанк по-японски: 9 лучших аниме в жанре «технологии нас погубят»

Япония сама по себе — сплошной киберпанк. Это заметил даже культовый писатель жанра Уильям Гибсон,…

21.02.2026

Не просто коробка с бантом. Как оригинально подарить гаджет: 5 незатратных способов

Сам по себе телефон Айфон 17 Про Макс – отличный подарок. У него красивая заводская…

12.02.2026

Лучшие криптобиржи для криптозаймов в 2025 году: где лучше брать кредит под крипту?

На фоне роста спроса на ликвидность в бычьем рынке 2025 года, криптозаймы снова выходят на…

09.07.2025

Что такое прокси-сервер: пояснение простыми словами, зачем нужны прокси

Прокси (proxy), или прокси-сервер — это программа-посредник, которая обеспечивает соединение между пользователем и интернет-ресурсом. Принцип…

21.11.2024

Что такое PWA приложение? Зачем необходимо прогрессивное веб-приложение

Согласитесь, было бы неплохо соединить в одно сайт и приложение для смартфона. Если вы еще…

19.11.2024