Телеграмм чат группы cmusphinx

2019 February 15

ММ

хм... это у меня вызывает ошибку
ERROR: "pocketsphinx.c", line 216: Failed to find mdef file inside the model folder specified with -hmm `cmusphinx-ru-5.2'

А почему может быть эта ошибка? Все файлы на месте

источник

09:10пожаловаться #1

NS

Nikolay Shmyrev in Распознавание речи

Мария Мамонова

А почему может быть эта ошибка? Все файлы на месте

https://www.youtube.com/watch?v=ephId3mYu9o

YouTube

Absolute and Relative Paths

This video is part of the Udacity course "Linux Command Line Basics". Watch the full course at https://www.udacity.com/course/ud595

источник

10:35пожаловаться #2

ап

алексей пономаренко in Распознавание речи

Николай, у меня следующий вопрос: на мой взгляд важным функционалом пакета sphinx4 под java являются классы работающие с анализом поступающего сигнала, мы говорим про livespeechrecognizer, то есть можно настраивать различные фильтры которые могут отсекать то что не является речью, что в последствии приводит к более чёткому распознованию. Есть ли в pocketsphinx такие возможности? Или для того чтоб использовать sphinx в python нужно писать собственные анализаторы и обработчики сигнала?

источник

11:34пожаловаться #3

rt

ros tel in Распознавание речи

https://pypi.org/project/pocketsphinx/

from pocketsphinx import LiveSpeech
...
не?

PyPI

pocketsphinx

Python interface to CMU Sphinxbase and Pocketsphinx libraries

источник

11:39пожаловаться #4

ап

алексей пономаренко in Распознавание речи

В общем то я имел ввиду вот это

источник

11:42пожаловаться #5

ап

алексей пономаренко in Распознавание речи

<component name="liveFrontEnd" type="edu.cmu.sphinx.frontend.FrontEnd"> <propertylist name="pipeline"> <item>dataSource </item> <item>dataBlocker </item> <item>speechClassifier </item> <item>speechMarker </item> <item>preemphasizer </item> <item>windower </item> <item>fft </item> <item>autoCepstrum </item> <item>liveCMN </item> <item>featureExtraction </item> <item>featureTransform </item> </propertylist> </component>

источник

11:42пожаловаться #6

rt

ros tel in Распознавание речи

пример как подавить шумы
https://realpython.com/python-speech-recognition/#the-effect-of-noise-on-speech-recognition

Realpython

The Ultimate Guide To Speech Recognition With Python – Real Python

An in-depth tutorial on speech recognition with Python. Learn which speech recognition library gives the best results and build a full-featured "Guess The Word" game with it.

источник

11:47пожаловаться #7

NS

Nikolay Shmyrev in Распознавание речи

алексей пономаренко

Николай, у меня следующий вопрос: на мой взгляд важным функционалом пакета sphinx4 под java являются классы работающие с анализом поступающего сигнала, мы говорим про livespeechrecognizer, то есть можно настраивать различные фильтры которые могут отсекать то что не является речью, что в последствии приводит к более чёткому распознованию. Есть ли в pocketsphinx такие возможности? Или для того чтоб использовать sphinx в python нужно писать собственные анализаторы и обработчики сигнала?

В pocketsphinx тоже самое всё есть, sphinxbase/src/libsphinxbase/fe/fe_noise

источник

11:49пожаловаться #8

NS

Nikolay Shmyrev in Распознавание речи

Фильтров ни в sphinx4 ни в pocketsphinx нет, только опеределение статического шума и сигнала. Музыку не фильтрует ничего.

источник

11:50пожаловаться #9

NS

Nikolay Shmyrev in Распознавание речи

ros tel

пример как подавить шумы
https://realpython.com/python-speech-recognition/#the-effect-of-noise-on-speech-recognition

Realpython

The Ultimate Guide To Speech Recognition With Python – Real Python

An in-depth tutorial on speech recognition with Python. Learn which speech recognition library gives the best results and build a full-featured "Guess The Word" game with it.

это как раз статья вредных советов

источник

11:52пожаловаться #10

ап

алексей пономаренко in Распознавание речи

SpeechClassifier

источник

11:55пожаловаться #11

ап

алексей пономаренко in Распознавание речи

На сколько я понимаю данный класс определяет что текущий сигнал является речью или нет

источник

11:55пожаловаться #12

NS

Nikolay Shmyrev in Распознавание речи

Ну как сказать, просто на энергию сигнала смотрит по отношению к шуму. В sphinxbase/fe_noise тоже самое

источник

11:56пожаловаться #13

NS

Nikolay Shmyrev in Распознавание речи

webrtcvad лучше работает гораздо.

источник

11:56пожаловаться #14

ап

алексей пономаренко in Распознавание речи

Также speechmarker, я столкнулся с ситуацией когда проглатывалась первая буква.. Данный класс помог мне от этого избавится

источник

11:59пожаловаться #15

NS

Nikolay Shmyrev in Распознавание речи

В pocketsphinx fe_prespch_buf

источник

11:59пожаловаться #16

ап

алексей пономаренко in Распознавание речи

Спасибо.. Пойду изучать

источник

12:00пожаловаться #17

ММ

Мария Мамонова in Распознавание речи

Есть проект на Python для распознавания речи с использованием pocketsphinx. Был сгенерирован свой словарь и файл грамматики. Однако возникает ошибка

RuntimeError: new_Decoder returned -1

А из детализации узнаем, что

ERROR: "fsg_search.c", line 141: The word 'экран' is missing in the dictionary

Однако слово "экран" есть в словаре.

Подскажите, как решить эту проблему?

Спасибо

Файл грамматики

#JSGF V1.0; grammar commands; <action> = (включить | выключить | опустить | поднять);
<device> = (проектор | экран | звук | презентацию);
public <commands> = <action> <device>;

Словарь

включить v k ll uj ch i tt выключить v y k ll uj ch ii tt проектор p r ay i k t oo r
экран eh k r ay n
звук z v uu k
опустить a p u ss tt ii tt
поднять p a d nn ja tt
презентацию p rr i zz i n t aa c y uj

источник

16:40пожаловаться #18

NS

Nikolay Shmyrev in Распознавание речи

Мария Мамонова

Есть проект на Python для распознавания речи с использованием pocketsphinx. Был сгенерирован свой словарь и файл грамматики. Однако возникает ошибка

RuntimeError: new_Decoder returned -1

А из детализации узнаем, что

ERROR: "fsg_search.c", line 141: The word 'экран' is missing in the dictionary

Однако слово "экран" есть в словаре.

Подскажите, как решить эту проблему?

Спасибо

Файл грамматики

#JSGF V1.0; grammar commands; <action> = (включить | выключить | опустить | поднять);
<device> = (проектор | экран | звук | презентацию);
public <commands> = <action> <device>;

Словарь

включить v k ll uj ch i tt выключить v y k ll uj ch ii tt проектор p r ay i k t oo r
экран eh k r ay n
звук z v uu k
опустить a p u ss tt ii tt
поднять p a d nn ja tt
презентацию p rr i zz i n t aa c y uj

фонемы eh нет в модели

источник

16:52пожаловаться #19

ММ

Мария Мамонова in Распознавание речи

ок, спасибо

источник

16:52пожаловаться #20