Size: a a a

Распознавание речи

2019 April 03

NS

Nikolay Shmyrev in Распознавание речи
Mini_librispeech
источник

A

Artyom in Распознавание речи
Спасибо!
источник
2019 April 08

AO

Andrei Obyortyshev in Распознавание речи
Добрался поиграться со скриптами. Причесал структуру модели аналогично английской из примера, и этто даже запустилось, но почти моментально упало с вот такой отладкой:

Traceback (most recent call last):
 File "./chain_live.py", line 136, in <module>
   user_utt, confidence = asr.decode(audio, finalize, stream_id=STREAM_ID)
 File "/usr/lib/python2.7/dist-packages/nltools/asr.py", line 131, in decode
   decoder.decode(sample_rate, np.array(audio, dtype=np.float32), do_finalize)
 File "kaldiasr/nnet3.pyx", line 170, in kaldiasr.nnet3.KaldiNNet3OnlineDecoder.decode (kaldiasr/nnet3.cpp:3968)
RuntimeError

Что с этим делать придумать не получилось. Нашел тикет на гитхабе по аналогичной проблеме с wav декодингом - посоветовали использовать wav 16кГц vjyj для входного файла.
Насколько я понимаю, для ру модели на вход требуется 8кГц. В pulseaudio покрутил default-sample-rate - не помогло. Получается, нужен моно микрофон чтоли?
источник

NS

Nikolay Shmyrev in Распознавание речи
Должно быть больше информации в выводе о причинах
источник

NS

Nikolay Shmyrev in Распознавание речи
микрофон специальный не нужно, pulseaudio само преобразует формат в нужный, в коде просто указать 8000 моно
источник

AO

Andrei Obyortyshev in Распознавание речи
А, окей. Значит настройками.

В тикете товарищи особо не обсуждали проблему. Отладки тоже не сыпет. Попробую поспрашивать.
источник

NS

Nikolay Shmyrev in Распознавание речи
в каком
источник

AO

Andrei Obyortyshev in Распознавание речи
https://github.com/gooofy/zamia-speech/issues/43

Там те же самые скрипты используются.
источник

NS

Nikolay Shmyrev in Распознавание речи
в mfcc.conf в модели можно добавить --allow-downsample=true
источник

NS

Nikolay Shmyrev in Распознавание речи
может поможет
источник
2019 April 09

A

Artyom in Распознавание речи
Добрый день! Канал вроде не про MaryTTS, но все звезды сюда сходятся. Пытаюсь собрать cmusphinx/voice-ac-nsh, все падает на этапе build'а, но проблема судя по всему еще при инициализации и заключается в: [HTTP HTTP/1.1 401 Authorization Required: http://alphacephei.com/test/tts/ac_ru_nsh_clunits-0.6.xml]. Эти файлы куда-то переехали или теперь их совсем нет? 😞
источник

NS

Nikolay Shmyrev in Распознавание речи
Artyom
Добрый день! Канал вроде не про MaryTTS, но все звезды сюда сходятся. Пытаюсь собрать cmusphinx/voice-ac-nsh, все падает на этапе build'а, но проблема судя по всему еще при инициализации и заключается в: [HTTP HTTP/1.1 401 Authorization Required: http://alphacephei.com/test/tts/ac_ru_nsh_clunits-0.6.xml]. Эти файлы куда-то переехали или теперь их совсем нет? 😞
источник

NS

Nikolay Shmyrev in Распознавание речи
без /test/
источник
2019 April 10

A

Artyom in Распознавание речи
Собирается, спасибо!
источник
2019 April 11

ДТ

Дмитрий Терехин in Распознавание речи
Добрый день. Пытаюсь обучить на данных с voxforge по egs mini_librispeech. Сконвертировал в формат librispeech, в качестве librispeech-lexicon использую ru.dic и в качестве librispeech-vocab ru.dic без лексикона. ru.dic взят из  zero_ru_cont_8k_v3. Однако возникают ошибки:
steps/align_si.sh: aligning data in data/train_clean_5 using model from exp/mono, putting alignments in exp/mono_ali_train_clean_5
ERROR: FstHeader::Read: Bad FST header: -
ERROR (fstdeterminizestar[5.5.274~3-58453]:ReadFstKaldi():kaldi-fst-io.cc:35) Reading FST: error reading FST header from standard input.
Может быть что-то не так делаю или упускаю?
источник

NS

Nikolay Shmyrev in Распознавание речи
параллельное декодирование с скрипте нужно убрать
источник

NS

Nikolay Shmyrev in Распознавание речи
отдельно тренировать, отдельно декодировать
источник

NS

Nikolay Shmyrev in Распознавание речи
истинную причину ошибки надо выше в выводе смотреть
источник

ДТ

Дмитрий Терехин in Распознавание речи
А существует ли способ тренировки voxforge в  tdnn? Сейчас в исходниках kaldi есть только sgmm2.  Или условно говоря замена
local/run_sgmm2.sh --nj $njobs
на
local/chain/run_tdnn.sh
должна помочь без дальнейшего вмешательства внутрь?
источник

NS

Nikolay Shmyrev in Распознавание речи
в mini_librispeech и так run_tdnn стоит
источник