Nex
Хорошо.
1) Есть ли русская модель? Как kaldi-ru.
2) Касательно тренировки, столкнулся с оверлапом и отрицательными значениями длительности при кластеризации через трешолд. Файлы сегментов, rttm всё моё(размечено автоматом по датасету мозилы). Насколько важен этот этап и/или где найти полное описание всего процесса(включая сегментации, разметку, эволюцию)?
1) Русских моделей нет, они от языка не сильно зависят, можно английские хвектора с успехом использовать, либо только plda обновить.
2) Этого быть не должно, ошибка либо в коде, либо в скриптах, надо искать ошибку.