В облаке пока наши давнешние модели. Новые мультиспикерные модели с улушенным управлением и стилями можно послушать в нашем боте @STC_TTS_bot. Надеюсь, что они появятся в облаке в начале следующего года.
Да, спасибо. Пока не все гладко там, надо ещё смотреть. Без fstpushspecial можно, но тишина не определяется, как я уже писал в комментарии. Может быть, надо H*C*push(det(L))) * G делать, не пробовал ещё.
кстати, 8 лет назад тоже делал это, правда не на калдишном графе и не на калдишном декодере. Пришлось в итоге переписать openfst-шную look-ahead композицию, так как массивы сгенеренных on-the-fly стейтов он не умел сбрасывать by-design. На длинных (порядка часов) файлах они разбухали, становилось грустно. Интересно,решили ли эту проблему в openfst.
кстати, 8 лет назад тоже делал это, правда не на калдишном графе и не на калдишном декодере. Пришлось в итоге переписать openfst-шную look-ahead композицию, так как массивы сгенеренных on-the-fly стейтов он не умел сбрасывать by-design. На длинных (порядка часов) файлах они разбухали, становилось грустно. Интересно,решили ли эту проблему в openfst.
Там теперь есть кэш. Когда он переполняется, старые сбрасываются