Size: a a a

Распознавание речи

2019 February 15

ММ

Мария Мамонова in Распознавание речи
Мария Мамонова
хм... это у меня вызывает ошибку
ERROR: "pocketsphinx.c", line 216: Failed to find mdef file inside the model folder specified with -hmm `cmusphinx-ru-5.2'
А почему может быть эта ошибка? Все файлы на месте
источник

NS

Nikolay Shmyrev in Распознавание речи
Мария Мамонова
А почему может быть эта ошибка? Все файлы на месте
источник

ап

алексей пономаренко in Распознавание речи
Николай, у меня следующий вопрос: на мой взгляд важным функционалом  пакета   sphinx4  под java являются классы работающие с анализом поступающего сигнала, мы говорим про  livespeechrecognizer, то есть можно настраивать различные фильтры которые могут отсекать то что не является речью, что в последствии приводит к более чёткому распознованию. Есть ли в pocketsphinx такие возможности? Или для того чтоб использовать sphinx в python нужно писать собственные  анализаторы и обработчики сигнала?
источник

rt

ros tel in Распознавание речи
https://pypi.org/project/pocketsphinx/

from pocketsphinx import LiveSpeech
...
не?
источник

ап

алексей пономаренко in Распознавание речи
В общем то я имел ввиду вот это
источник

ап

алексей пономаренко in Распознавание речи
<component name="liveFrontEnd" type="edu.cmu.sphinx.frontend.FrontEnd"> <propertylist name="pipeline"> <item>dataSource </item> <item>dataBlocker </item> <item>speechClassifier </item> <item>speechMarker </item> <item>preemphasizer </item> <item>windower </item> <item>fft </item> <item>autoCepstrum </item> <item>liveCMN </item> <item>featureExtraction </item> <item>featureTransform </item> </propertylist> </component>
источник

rt

ros tel in Распознавание речи
источник

NS

Nikolay Shmyrev in Распознавание речи
алексей пономаренко
Николай, у меня следующий вопрос: на мой взгляд важным функционалом  пакета   sphinx4  под java являются классы работающие с анализом поступающего сигнала, мы говорим про  livespeechrecognizer, то есть можно настраивать различные фильтры которые могут отсекать то что не является речью, что в последствии приводит к более чёткому распознованию. Есть ли в pocketsphinx такие возможности? Или для того чтоб использовать sphinx в python нужно писать собственные  анализаторы и обработчики сигнала?
В pocketsphinx тоже самое всё есть, sphinxbase/src/libsphinxbase/fe/fe_noise
источник

NS

Nikolay Shmyrev in Распознавание речи
Фильтров ни в sphinx4 ни в pocketsphinx нет, только опеределение статического шума и сигнала. Музыку не фильтрует ничего.
источник

NS

Nikolay Shmyrev in Распознавание речи
это как раз статья вредных советов
источник

ап

алексей пономаренко in Распознавание речи
SpeechClassifier
источник

ап

алексей пономаренко in Распознавание речи
На сколько я понимаю данный класс определяет что текущий сигнал является речью или нет
источник

NS

Nikolay Shmyrev in Распознавание речи
Ну как сказать, просто на энергию сигнала смотрит по отношению к шуму. В sphinxbase/fe_noise тоже самое
источник

NS

Nikolay Shmyrev in Распознавание речи
webrtcvad лучше работает гораздо.
источник

ап

алексей пономаренко in Распознавание речи
Также speechmarker, я столкнулся с ситуацией когда проглатывалась первая буква.. Данный класс помог мне от этого избавится
источник

NS

Nikolay Shmyrev in Распознавание речи
В pocketsphinx fe_prespch_buf
источник

ап

алексей пономаренко in Распознавание речи
Спасибо.. Пойду изучать
источник

ММ

Мария Мамонова in Распознавание речи
Есть проект на Python для распознавания речи с использованием pocketsphinx. Был сгенерирован свой словарь и файл грамматики. Однако возникает ошибка

RuntimeError: new_Decoder returned -1

А из детализации узнаем, что

ERROR: "fsg_search.c", line 141: The word 'экран' is missing in the dictionary

Однако слово "экран" есть в словаре.

Подскажите, как решить эту проблему?

Спасибо

Файл грамматики

#JSGF V1.0; grammar commands; <action> = (включить | выключить | опустить | поднять);
<device> = (проектор | экран | звук | презентацию);
public <commands> = <action> <device>;

Словарь

включить v k ll uj ch i tt выключить v y k ll uj ch ii tt проектор p r ay i k t oo r
экран eh k r ay n
звук z v uu k
опустить a p u ss tt ii tt
поднять p a d nn ja tt
презентацию p rr i zz i n t aa c y uj
источник

NS

Nikolay Shmyrev in Распознавание речи
Мария Мамонова
Есть проект на Python для распознавания речи с использованием pocketsphinx. Был сгенерирован свой словарь и файл грамматики. Однако возникает ошибка

RuntimeError: new_Decoder returned -1

А из детализации узнаем, что

ERROR: "fsg_search.c", line 141: The word 'экран' is missing in the dictionary

Однако слово "экран" есть в словаре.

Подскажите, как решить эту проблему?

Спасибо

Файл грамматики

#JSGF V1.0; grammar commands; <action> = (включить | выключить | опустить | поднять);
<device> = (проектор | экран | звук | презентацию);
public <commands> = <action> <device>;

Словарь

включить v k ll uj ch i tt выключить v y k ll uj ch ii tt проектор p r ay i k t oo r
экран eh k r ay n
звук z v uu k
опустить a p u ss tt ii tt
поднять p a d nn ja tt
презентацию p rr i zz i n t aa c y uj
фонемы eh нет в модели
источник

ММ

Мария Мамонова in Распознавание речи
ок, спасибо
источник