Телеграмм чат группы cmusphinx

18:42пожаловаться #8

2017 October 07

а что даёт этот гист? я могу запустить у себя оффлайн сервер распознавания? эту штуку можно включить в режим keyword spotting?

01:18пожаловаться #9

что значит online recognition в данном случае?

01:18пожаловаться #10

http://kaldi-asr.org/doc/online_decoding.html

01:19пожаловаться #11

спс буду читать

01:19пожаловаться #12

грубо говоря, онлайн распознавание = когда недоступно всё предложение или весь текст, сказанный "в будущем", получается

01:20пожаловаться #13

распознавание по живой речи (говорят в микрофон, и тут же получаем распознавание), против распознавания ранее записанного файла (то что оригинальный decode.sh демонстрирует)

01:22пожаловаться #14

ну то есть, нельзя сделать более точные гипотезы на основании тех слов, которые прозвучат только в конце предложения

01:22пожаловаться #15

вот это надо читать
http://kaldi-asr.org/doc/dnn3_scripts_context.html

01:23пожаловаться #16

2017 October 08

Николай, здравствуйте!
Вы писали

"У Kaldi есть OnlineNnet2FeaturePipeline с i-векторами
и OnlineFeaturePipeline без i-векторов
Вот нужно переделать с Nnet2 на Nnet и будет работать"

Пытаюсь разобраться по аналогии с online2-wav-nnet3-latgen-faster.
Он использует SingleUtteranceNnet3Decoder, который в свою очередь в зависимости имеет OnlineNnet2FeaturePipeline

Т.е., чтобы сделать что вы предлагаете (запустить kaldi-ru-2 на OnlineFeaturePipeline), наиболее короткий путь - написать что-то аналогичное SingleUtteranceNnet3Decoder, который умеет работать с OnlineFeaturePipeline?

00:19пожаловаться #17

странно что online2-wav-nnet3-latgen-faster вроде что-то вменяемое отвечает, хоть и Nnet2 pipeline

Nikolay Shmyrev in Распознавание речи

00:20пожаловаться #18

не должен

Nikolay Shmyrev in Распознавание речи

00:23пожаловаться #19

переписывать decoder не надо, просто передать ему onlinefeaturepipeline