Телеграмм чат группы cmusphinx

Добрался поиграться со скриптами. Причесал структуру модели аналогично английской из примера, и этто даже запустилось, но почти моментально упало с вот такой отладкой:

Traceback (most recent call last):
File "./chain_live.py", line 136, in <module>
user_utt, confidence = asr.decode(audio, finalize, stream_id=STREAM_ID)
File "/usr/lib/python2.7/dist-packages/nltools/asr.py", line 131, in decode
decoder.decode(sample_rate, np.array(audio, dtype=np.float32), do_finalize)
File "kaldiasr/nnet3.pyx", line 170, in kaldiasr.nnet3.KaldiNNet3OnlineDecoder.decode (kaldiasr/nnet3.cpp:3968)
RuntimeError

Что с этим делать придумать не получилось. Нашел тикет на гитхабе по аналогичной проблеме с wav декодингом - посоветовали использовать wav 16кГц vjyj для входного файла.
Насколько я понимаю, для ру модели на вход требуется 8кГц. В pulseaudio покрутил default-sample-rate - не помогло. Получается, нужен моно микрофон чтоли?

источник

11:49пожаловаться #3

Nikolay Shmyrev in Распознавание речи

Должно быть больше информации в выводе о причинах

источник

12:11пожаловаться #4

Nikolay Shmyrev in Распознавание речи

микрофон специальный не нужно, pulseaudio само преобразует формат в нужный, в коде просто указать 8000 моно

источник

12:30пожаловаться #5

Andrei Obyortyshev in Распознавание речи

А, окей. Значит настройками.

В тикете товарищи особо не обсуждали проблему. Отладки тоже не сыпет. Попробую поспрашивать.

источник

12:40пожаловаться #6

Nikolay Shmyrev in Распознавание речи

в каком

источник

12:41пожаловаться #7

Andrei Obyortyshev in Распознавание речи

https://github.com/gooofy/zamia-speech/issues/43

Там те же самые скрипты используются.

GitHub

Runtime error on Demo program · Issue #43 · gooofy/zamia-speech

I have been following the Github Quickstart link which converts 4 demo wavs files to text. It works fine, but now when I use my own Wav file it throughs an error as below: Traceback (most recent ca...

источник

12:42пожаловаться #8

Nikolay Shmyrev in Распознавание речи

в mfcc.conf в модели можно добавить --allow-downsample=true

источник

12:46пожаловаться #9

Nikolay Shmyrev in Распознавание речи

может поможет

источник

12:46пожаловаться #10

2019 April 09

Artyom in Распознавание речи

Добрый день! Канал вроде не про MaryTTS, но все звезды сюда сходятся. Пытаюсь собрать cmusphinx/voice-ac-nsh, все падает на этапе build'а, но проблема судя по всему еще при инициализации и заключается в: [HTTP HTTP/1.1 401 Authorization Required: http://alphacephei.com/test/tts/ac_ru_nsh_clunits-0.6.xml]. Эти файлы куда-то переехали или теперь их совсем нет? 😞

источник

09:34пожаловаться #11

Nikolay Shmyrev in Распознавание речи

Artyom

http://alphacephei.com/tts/ac_ru_nsh_clunits-0.6.tar.bz2

источник

14:52пожаловаться #12

Nikolay Shmyrev in Распознавание речи

без /test/

источник

14:52пожаловаться #13

2019 April 10

Artyom in Распознавание речи

Собирается, спасибо!

источник

06:07пожаловаться #14

2019 April 11

ДТ

Дмитрий Терехин in Распознавание речи

Добрый день. Пытаюсь обучить на данных с voxforge по egs mini_librispeech. Сконвертировал в формат librispeech, в качестве librispeech-lexicon использую ru.dic и в качестве librispeech-vocab ru.dic без лексикона. ru.dic взят из zero_ru_cont_8k_v3. Однако возникают ошибки:

steps/align_si.sh: aligning data in data/train_clean_5 using model from exp/mono, putting alignments in exp/mono_ali_train_clean_5
ERROR: FstHeader::Read: Bad FST header: -
ERROR (fstdeterminizestar[5.5.274~3-58453]:ReadFstKaldi():kaldi-fst-io.cc:35) Reading FST: error reading FST header from standard input.

Может быть что-то не так делаю или упускаю?

источник

07:18пожаловаться #15

Nikolay Shmyrev in Распознавание речи

параллельное декодирование с скрипте нужно убрать

источник

10:09пожаловаться #16

Nikolay Shmyrev in Распознавание речи

отдельно тренировать, отдельно декодировать

источник

10:09пожаловаться #17

Nikolay Shmyrev in Распознавание речи