Size: a a a

Распознавание речи

2019 July 06

NS

Nikolay Shmyrev in Распознавание речи
хорошо, буду теги добавлять
источник

T

Toronto in Распознавание речи
Всем привет! Подскажите, есть ли годный туториал по обучению акустической модели для kaldi?
источник

NS

Nikolay Shmyrev in Распознавание речи
Нет такого
источник

T

Toronto in Распознавание речи
Спасибо. А что-то почитать на эту тему за исключением документации ?
источник

NS

Nikolay Shmyrev in Распознавание речи
Читать тут ничего не надо, пробовать надо
источник

T

Toronto in Распознавание речи
Спесибо. Ищу с чего начать
источник

NS

Nikolay Shmyrev in Распознавание речи
tedlium запустить и делать по образцу
источник

NS

Nikolay Shmyrev in Распознавание речи
Или даже mini_librispeech
источник

NS

Nikolay Shmyrev in Распознавание речи
пожалуй даже mini_librispeech лучше
источник

T

Toronto in Распознавание речи
Понял. Было бы круто найти этот образец.
источник

NS

Nikolay Shmyrev in Распознавание речи
mini_librispeech написал же
источник

II

Igor Ishin in Распознавание речи
В  kaldi/egs находится
источник
2019 July 08

II

Igor Ishin in Распознавание речи
Здравствуйте, в py-kaldi-asr использовали CompactLatticeToWordAlignment он как-то странно выводит время и длительность каждого слова, а в Вашем проекте kaldi-websocket-python, Вы использовали WordAlignLattice, поскольку я не смог запустить его, я правильно понимаю, что он выводит также текст и время(такие же значения), как и Ваш decode.sh?
источник

NS

Nikolay Shmyrev in Распознавание речи
Да
источник

II

Igor Ishin in Распознавание речи
Благодарю, а с CompactLatticeToWordAlignment можно что-то сделать чтобы он нормальные значения времени выводил?
источник

NS

Nikolay Shmyrev in Распознавание речи
Можно, там наверное frame size 0.03 надо задать
источник

II

Igor Ishin in Распознавание речи
Frame size я задавал, там вдобавок неправильно считается длительность
источник

NS

Nikolay Shmyrev in Распознавание речи
Давайте пример посмотрю
источник

II

Igor Ishin in Распознавание речи
источник

II

Igor Ishin in Распознавание речи
Я только GetDiagnosticsAndPrintOutput изменил, заранее извините за увиденное)
источник