API распознавания речи

Существует ли API для распознавания речи в Ubuntu/Linux? У меня есть школьный проект, и мне нужно преобразовать речь в письменный текст. Язык программирования не проблема. Я пробовал cmu-sphinx, но мне не очень повезло с этим, то есть он на самом деле не распознавал многое из моей определенной грамматики или просто смешал слова. Любая помощь по этому вопросу будет принята с благодарностью. Я также искал в Google и не мог найти много информации.

3 ответа

Двумя основными движками распознавания речи с открытым исходным кодом в Ubuntu являются Julius и Pocketsphinx. Оба эти проекта являются исследовательскими проектами низкого уровня, и вам нужно много читать и экспериментировать, чтобы иметь возможность их использовать: это не простые проекты установки и запуска. Simon Listens, как упоминалось выше, является простым проектом установки и запуска, а проект Simon Listens имеет специальную установку для Ubuntu - http://www.cyber-byte.at/wiki/index.php/Installation есть инструкции по его включению, но это работает только с 10.04, а не с недавно выпущенным 10.10. (Надеюсь, проект Simon Listens скоро выпустит версию 10.10.)

Есть Java Speech API, который работает кроссплатформенно...

Также взгляните на Simon Listens, который использует движок с открытым исходным кодом CSR Julius.

Другие вопросы по тегам