Голосовое управление средой рабочего стола
Я хотел бы включить систему, которая может отвечать на голосовые команды пользователя и запускать сценарии в соответствии с устной командой GIVEN.
В идеале хотелось бы, чтобы компьютер постоянно слушал.
Как только он услышит модное слово "Компьютер", он активируется и будет слушать команды в течение 10 секунд (или около того).
Будучи активным и слушающим, я хотел бы, чтобы другой набор модных слов мог запускать сценарии.
Например....
(Компьютер бездействует) "Компьютер" (компьютер сразу слушает) "Доступ к новым СООБЩЕНИЯМ" (СООБЩЕНИЯ - это модное слово * ИГНОРИРУЕТ "ДОСТУП К НОВОМУ" - компьютер запускает сценарий и открывает эволюцию или сочувствие). Там может быть один для браузера, один для закрытия окон и отображения рабочего стола, или куча вещей на самом деле.
Это вообще возможно?
5 ответов
Gnome-Voice-Control
Разработанная в рамках Google Summer of Code 2007, эта идея была направлена на разработку некоторых функций, которые повысят удобство использования в Gnome Desktop.
Целью является внедрение системы голосового управления настольным компьютером. Система состоит из приложения, которое будет контролировать аудиовход (микрофон), и когда значительный аудиосигнал будет обнаружен, программное обеспечение перехватывает, обрабатывает и распознает сигнал, а затем выполняет требуемое действие на рабочем столе Gnome. В набор действий могут входить максимизация, минимизация, закрытие активного окна; открыть конкретную программу; переключение с одного рабочего стола на другой; среди других. GnomeVoiceControl реализован на C в сочетании с CMU Sphinx, который является инструментом с открытым исходным кодом, созданным для преобразования речи в текст.
К сожалению, похоже, что он не вышел далеко за рамки базовых "целей", однако, похоже, что в этом году была добавлена поддержка новых языков, таких как болгарский и турецкий.
Установить:
sudo apt-get install gnome-voice-control
утконос
Интересный проект называется platypus - по сути, это интерфейс Linux для Dragon Naturally Speaking, который работает в Wine.
Заявка на известность этого приложения: "оно может даже запускать программы и сценарии Windows или Linux, например," запуск терминала ".
VEDICS
Это новый проект, который говорит, что работает с интерфейсом Unity.
На странице проекта написано, что она распознает "run [имя программы]" - так что теоретически вы [имя программы] можете использовать любой скрипт, который хотите запустить.
Саймон слушает
Это проект с открытым исходным кодом, предназначенный для замены мыши и / или клавиатуры распознаванием речи, изначально разработанный для людей с ограниченными возможностями.
Существует ppa, откуда мы можем установить приложение : ppa: grasch-simon-listens / simon
Google2Ubuntu
Google2Ubuntu - это инструмент, позволяющий управлять вашим компьютером с помощью голосовых команд через API распознавания речи Google.
Выполните следующие команды на терминале для установки google2Ubuntu
,
sudo add-apt-repository ppa:benoitfra/google2ubuntu
sudo apt-get update
sudo apt-get install google2ubuntu
Источник
Распознавание речи в Linux
Он разрабатывается для работы в дистрибутивах Linux, его очень легко настраивать и расширять, он поддерживает пользовательские словари, распознавание по контексту, режим диктовки и настраиваемые макросы.
Чтобы установить Linux Speech Recognition, перейдите на страницу проекта GitHub. Загрузите ZIP-файл и распакуйте его.
Затем установите некоторые зависимости:
sudo apt-get install sox python-argparse libsox-fmt-mp3 mutt xvkbd xautomation
Откройте извлеченную папку (Palaver-master) в терминале и выполните настройку:
cd /~Path-to-folder~/Palaver-master/
./setup
Теперь просто назначьте горячую клавишу для включения записи, для этого перейдите в "Настройки системы"> "Клавиатура"> "Ярлыки"> "Пользовательские ярлыки", нажмите кнопку "Плюс", чтобы добавить ярлык, назовите его "Распознавание голоса" и установите для команды следующее:
/~Path-to-folder~/Palaver-master/hotkey
Нажмите "Применить", нажмите на ярлык, а затем назначьте горячую клавишу для активации распознавания голоса.
Обратите внимание, что стабильная сборка еще не выпущена, поэтому не ожидайте, что команды будут полностью функциональными на этом этапе, многие фразы будут распознаны, но никаких реальных действий не будет сделано.