Size: a a a

Распознавание речи

2019 November 25

IK

Ilya Kalinovskiy in Распознавание речи
В облаке пока наши давнешние модели.
Новые мультиспикерные модели с улушенным управлением и стилями можно послушать в нашем боте @STC_TTS_bot.
Надеюсь, что они появятся в облаке в начале следующего года.
источник

IK

Ilya Kalinovskiy in Распознавание речи
источник

NS

Nikolay Shmyrev in Распознавание речи
Ниче так
источник

AZ

Al Zatv in Распознавание речи
источник

NS

Nikolay Shmyrev in Распознавание речи
источник

NS

Nikolay Shmyrev in Распознавание речи
тоже неплохо
источник

NS

Nikolay Shmyrev in Распознавание речи
Ещё оттуда-же
источник

NS

Nikolay Shmyrev in Распознавание речи
источник

N

Nurtas in Распознавание речи
Nikolay Shmyrev
Ещё оттуда-же
😅😂
источник
2019 November 26

NS

Nikolay Shmyrev in Распознавание речи
источник

IG

Igor Goncharovskiy in Распознавание речи
Хехе
источник

AS

Andrew Stepanov in Распознавание речи
@nshmyrev а ты на конфе?
источник

NS

Nikolay Shmyrev in Распознавание речи
Да в бизнес зале сижу на кубике у окна
источник
2019 November 28

Aλexander Λaptev in Распознавание речи
Не уверен, было тут, или нет.
https://github.com/kaldi-asr/kaldi/pull/3616
@nshmyrev Комьюнити вам будет весьма благодарно!
P.S. fstpushspecial для HCL использовать формально нельзя: https://groups.google.com/forum/#!searchin/kaldi-developers/HCL%7Csort:date/kaldi-developers/ZJqiqy0z57Y/J_ZFAC5KEgAJ
источник

NS

Nikolay Shmyrev in Распознавание речи
Да, спасибо. Пока не все гладко там, надо ещё смотреть. Без fstpushspecial можно, но тишина не определяется, как я уже писал в комментарии. Может быть, надо H*C*push(det(L))) * G делать, не пробовал ещё.
источник

NS

Nikolay Shmyrev in Распознавание речи
А то, что Дэнэль по поводу нестохастичный пишет, не совсем правда, у HCL fstisstochastic почти точно 0.
источник

AZ

Al Zatv in Распознавание речи
кстати, 8 лет назад тоже делал это, правда не на калдишном графе и не на калдишном декодере. Пришлось в итоге переписать openfst-шную look-ahead композицию, так как массивы сгенеренных on-the-fly стейтов он не умел сбрасывать by-design. На длинных (порядка часов) файлах они разбухали, становилось грустно. Интересно,решили ли эту проблему в openfst.
источник

Aλexander Λaptev in Распознавание речи
Al Zatv
кстати, 8 лет назад тоже делал это, правда не на калдишном графе и не на калдишном декодере. Пришлось в итоге переписать openfst-шную look-ahead композицию, так как массивы сгенеренных on-the-fly стейтов он не умел сбрасывать by-design. На длинных (порядка часов) файлах они разбухали, становилось грустно. Интересно,решили ли эту проблему в openfst.
Там теперь есть кэш. Когда он переполняется, старые сбрасываются
источник

AZ

Al Zatv in Распознавание речи
кеш дуг там был всегда, и был со сбросом, а кеш стейтов кажись нет. мож сделали.
источник

Aλexander Λaptev in Распознавание речи
Когда я это делал, там просто можно было указать размер кэша и радоваться жизни. По крайней мере, распухание по памяти замечено не было.
источник