Такотрона. Николай если тестировал на стабильность может рассказать как оно. В deep voice 3 в appendix есть специальный датасет для стабильности (100 предложений) https://arxiv.org/pdf/1710.07654.pdf
А вы его не обучали сами? Прямые конкуренты моего заказчика вот недавно обучили и запустили базовый вариант такотрон2 и там прям очень хорошее на слух качество