Size: a a a

Распознавание речи

2019 November 28

AZ

Al Zatv in Распознавание речи
круто, прогресс
источник

Aλexander Λaptev in Распознавание речи
Правда, в openfst lookahead довольно медленный. На практике было-бы здорово иметь возможность преинициализировать HCLG, как пишут в https://arxiv.org/abs/1910.10670
источник

Aλexander Λaptev in Распознавание речи
@nshmyrev тогда непонято, почему fstpushspecial всё портит.
Когда я этим занимался, я взял рецепт http://bozskyfilip.blogspot.com/2017/11/how-make-hcl-and-g-graphs-and-on-fly.html, долго над ним страдал, и в конце обнаружил, что из него просто нужно выкинуть fstpushspecial на этапе сборки HCL.fst из det.HaCL.fst, чтобы результаты сошлись с оффлайновой композицией.
источник

NS

Nikolay Shmyrev in Распознавание речи
Aλexander Λaptev
@nshmyrev тогда непонято, почему fstpushspecial всё портит.
Когда я этим занимался, я взял рецепт http://bozskyfilip.blogspot.com/2017/11/how-make-hcl-and-g-graphs-and-on-fly.html, долго над ним страдал, и в конце обнаружил, что из него просто нужно выкинуть fstpushspecial на этапе сборки HCL.fst из det.HaCL.fst, чтобы результаты сошлись с оффлайновой композицией.
Почему портит понятно - работает неточно и делает не то, что нужно. А вот почему без него не работает тоже, это вопрос. Сейчас попробовал ещё с minimize(det(L)), виснет на librispeech. Там в sil фонемы на концах добавляются, думаю из-за этого. Никогда мне эти sil не нравились 😉
источник

Aλexander Λaptev in Распознавание речи
Nikolay Shmyrev
Почему портит понятно - работает неточно и делает не то, что нужно. А вот почему без него не работает тоже, это вопрос. Сейчас попробовал ещё с minimize(det(L)), виснет на librispeech. Там в sil фонемы на концах добавляются, думаю из-за этого. Никогда мне эти sil не нравились 😉
Это только на librispeech наигрывается? Мы такие проблемы, вроде, не ловили...
источник

NS

Nikolay Shmyrev in Распознавание речи
На маленьких модельках для андроида тоже. Короче посмотрю на неделе, напишу потом.
источник
2019 November 30

a

agic in Распознавание речи
источник

a

agic in Распознавание речи
источник

a

agic in Распознавание речи
По моему в этом чате црт был? Или я путаю
источник

Aλexander Λaptev in Распознавание речи
Кое-то из црт тут есть, да.
источник
2019 December 01

VM

Vladimir Mevedev in Распознавание речи
Пытаю https://github.com/alphacep/kaldi-websocket-python - не плохо работает - но мой источник дает slin16 16000 bit / sek  Не хочется конвертировать - можно заставить kaldi  работать на 16000 ? И это  лучше / хуже 8000 ?
источник

NS

Nikolay Shmyrev in Распознавание речи
Vladimir Mevedev
Пытаю https://github.com/alphacep/kaldi-websocket-python - не плохо работает - но мой источник дает slin16 16000 bit / sek  Не хочется конвертировать - можно заставить kaldi  работать на 16000 ? И это  лучше / хуже 8000 ?
Модель новую натренировать. Обычно на 10% меньше ошибка относительно.
источник

VM

Vladimir Mevedev in Распознавание речи
10% это много  ? Стоит игра свеч ? А потребление вычислительных ресурсов 8000 vs 16000 ?
источник

NS

Nikolay Shmyrev in Распознавание речи
смотря почём свечи 😉
источник

VM

Vladimir Mevedev in Распознавание речи
Потребление вычислительных ресурсов - есть разница ? 8000 vs 16000 ?
источник

NS

Nikolay Shmyrev in Распознавание речи
нет
источник

VM

Vladimir Mevedev in Распознавание речи
У меня источник телефония ulaw - пытаюсь прикрутить   /channels/externalMedia - а у них сейчас работает только slin16 16000 бит/сек  или ulaw 8000 format - по сути источник у меня 8000 - думаю не стоит тренироваться
источник

NS

Nikolay Shmyrev in Распознавание речи
согласен
источник
2019 December 03

AZ

Al Zatv in Распознавание речи
uouo111845  Dec 2, 2019, 3:47 AM
你好 我是初学者,请问如果我有自己用kaldi train好的模型,该如何更新模型,有要改那些文件,再麻烦教我一下如何修改,非常感谢!

Nickolay V. Shmyrev
您只需更改模型文件夹中的文件
模型必须很小,否则解码将非常慢
источник

AZ

Al Zatv in Распознавание речи
Шикарно, Николай еще и на китайском говорит:) это из калдишного листа рассылки фрамент.
источник