Size: a a a

Распознавание речи

2017 October 06

NS

Nikolay Shmyrev in Распознавание речи
Получится но без ивекторов
источник

NS

Nikolay Shmyrev in Распознавание речи
Они не нужны
источник

AC

Artyom Chernetsov in Распознавание речи
понял, буду искать. Я думал ivector обязателен для online. Спасибо!
источник

AC

Artyom Chernetsov in Распознавание речи
в egs есть шанс найти пример online без ivector? )
источник

NS

Nikolay Shmyrev in Распознавание речи
egs тут не причём тренировать ничего не нужно
источник

NS

Nikolay Shmyrev in Распознавание речи
писал уже выше, в исходниках нужно поменять onlinennet2pipeline на onlinennetpipeline
источник

AC

Artyom Chernetsov in Распознавание речи
виноват. Я по докам и примерам действую, и сошел с пути истинного )
Спасибо.
источник

AC

Artyom Chernetsov in Распознавание речи
Получилось. Может кому пригодится, а-то я позорно долго промучился для такого тривиального решения

https://gist.github.com/achernetsov/3b15df6a56f757039589ea167483584c
источник
2017 October 07

LV

Leo V in Распознавание речи
а что даёт этот гист? я могу запустить у себя оффлайн сервер распознавания? эту штуку можно включить в режим keyword spotting?
источник

LV

Leo V in Распознавание речи
что значит online recognition в данном случае?
источник

AC

Artyom Chernetsov in Распознавание речи
источник

LV

Leo V in Распознавание речи
спс буду читать
источник

LV

Leo V in Распознавание речи
грубо говоря, онлайн распознавание = когда недоступно всё предложение или весь текст, сказанный "в будущем", получается
источник

AC

Artyom Chernetsov in Распознавание речи
распознавание по живой речи (говорят в микрофон, и тут же получаем распознавание), против распознавания ранее записанного файла (то что оригинальный decode.sh демонстрирует)
источник

LV

Leo V in Распознавание речи
ну то есть, нельзя сделать более точные гипотезы на основании тех слов, которые прозвучат только в конце предложения
источник

AC

Artyom Chernetsov in Распознавание речи
вот это надо читать
http://kaldi-asr.org/doc/dnn3_scripts_context.html
источник
2017 October 08

AC

Artyom Chernetsov in Распознавание речи
Николай, здравствуйте!
Вы писали

"У Kaldi есть OnlineNnet2FeaturePipeline с i-векторами
и OnlineFeaturePipeline без i-векторов
Вот нужно переделать с Nnet2 на Nnet и будет работать"

Пытаюсь разобраться по аналогии с online2-wav-nnet3-latgen-faster.
Он использует SingleUtteranceNnet3Decoder, который в свою очередь в зависимости имеет OnlineNnet2FeaturePipeline

Т.е., чтобы сделать что вы предлагаете (запустить kaldi-ru-2 на OnlineFeaturePipeline), наиболее короткий путь - написать что-то аналогичное SingleUtteranceNnet3Decoder, который умеет работать с OnlineFeaturePipeline?
источник

AC

Artyom Chernetsov in Распознавание речи
странно что online2-wav-nnet3-latgen-faster вроде что-то вменяемое отвечает, хоть и Nnet2 pipeline
источник

NS

Nikolay Shmyrev in Распознавание речи
не должен
источник

NS

Nikolay Shmyrev in Распознавание речи
переписывать decoder не надо, просто передать ему onlinefeaturepipeline
источник