Вопрос по c#, visual-studio-2010 – Как распознать фразу из голосового файла

4

Как заставить движок успешно распознавать фразу из голосового файла (wav / mp3 / etc ..)?

Например, если у меня будет голосовой файл и письменный текст контекста того же файла, чтобы он мог распознавать записанные слова в голосовом файле.

Я пытался поиграть с SpeechRecognitionEngine, но пока безуспешно.

Я буду признателен за идеи, поскольку я впервые имею дело с методами распознавания речи.

Я видел примеры преобразования речи в текст с использованием словарей, но я не уверен, насколько это может быть полезно здесь. Я думал о том, чтобы, возможно, преобразовать весь голосовой файл в текст, а затем просто искать конкретную фразу в этом тексте, но я не думаю, что это правильный путь. Кажется, не имеет смысла преобразовывать, например, 5-часовой голос в текст ... или, может быть, использовать конкретную фразу в качестве "словаря"? и искать этот пункт в голосовом файле.

Я немного отредактировал вопрос с указаниями, о которых я думал ... Мне пришло в голову преобразовать весь голос в текст, а затем выполнить простой поиск, но это кажется глупым решением ... user990635
Спасибо за понижение, ребята ... но вы также можете помочь с ответом? :) user990635

Ваш Ответ

3   ответа
0

icrosoft, вам следует проявить определенную осторожность. Во-первых, единственный поддерживаемый формат - это WAV (он может быть закодирован как PCM, ALaw или uLaw), но вы должны убедиться, что ваш файл имеет формат, поддерживаемый вашим распознавателем. Вы также должны проверить частоту дискретизации. Распознаватели поддерживают только фиксированный набор частот дискретизации. На моей машине

8 bits per sample single channel mono 22,050 samples per second PCM encoding

работает хорошо. Увидетьhttps://stackoverflow.com/a/6203533/90236 для получения дополнительной информации. Возможно, вам придется повторно сэмплировать или перекодировать файлы WAV, используя такой инструмент, какдерзость, Увидетьhttps://stackoverflow.com/a/9467044/90236.

Простой пример, чтобы вы началиSAPI и Windows 7 Проблема.

Наконец, (я всегда повторяю этот пункт, извините) есть отличная статья о распознавании программ в Windows .NET. Увидетьhttp://msdn.microsoft.com/en-us/magazine/cc163663.aspxЭто немного устарело, но отличное введение.

0

Начало работы с распознаванием речи.

Шаги, которые вам нужно сделать, это (из статьи). Обратите внимание на шаг создания грамматики распознавания. Далее в статье предлагается использоватьGrammerBuilder или жеВыбор Классы.

A speech recognition application will typically perform the following basic operations:
- Start the speech recognizer.
- Create a recognition grammar.
- Load the grammar into the speech recognizer.
- Register for speech recognition event notification.
- Create a handler for the speech recognition event.

6

вам нужно искать определенное слово в длинном файле. Эта методика называется «Определение ключевых слов», она значительно отличается от распознавания речи и является более эффективной. Очевидно, что вам не нужно транскрибировать весь файл для поиска слова в нем, вы можете быстро просмотреть файл. Механизм распознавания речи в Microsoft имеет очень ограниченную поддержку определения ключевых слов.

Двигатели с открытым исходным кодом, такие какCMUSphinx может быть использован для эффективной реализации поиска ключевых слов. См. Для дальнейших ссылок информацию окак реализовать пробуждение при прослушивании с помощью pocketsphinx.

Для получения дополнительной информации об основных алгоритмах см.АКУСТИЧЕСКИЕ КЛЮЧЕВЫЕ СЛОВА В РЕЧИ С ПРИЛОЖЕНИЯМИ ДЛЯ ДОБЫЧИ ДАННЫХ

Похожие вопросы