Size: a a a

Распознавание речи

2019 July 10

V

Vlad in Распознавание речи
Это в каком смысле?) Как он может быть нестабилен?)
Или вы имеете ввиду проблемы с интонацией?
источник

VK

Viacheslav Klimkov in Распознавание речи
Может пропускать фонемы, слова, не синтезировать слишком длинные или специфические предложения
источник

V

Vlad in Распознавание речи
Ого... Это проблема такотрона или данной реализации от админа?
источник

VK

Viacheslav Klimkov in Распознавание речи
Такотрона. Николай если тестировал на стабильность может рассказать как оно. В deep voice 3 в appendix есть специальный датасет для стабильности (100 предложений) https://arxiv.org/pdf/1710.07654.pdf
источник

NS

Nikolay Shmyrev in Распознавание речи
Не тестировал
источник

VK

Viacheslav Klimkov in Распознавание речи
В оригинальной статье тоже есть результаты на этом датасете https://arxiv.org/pdf/1712.05884.pdf предпоследний параграф 3.2
источник

V

Vlad in Распознавание речи
Да уж, неожиданно
И причём в своём сервисе синтеза речи гугл насколько я знаю использует такотрон2
источник

VK

Viacheslav Klimkov in Распознавание речи
Нет
источник

VK

Viacheslav Klimkov in Распознавание речи
Chive + parallel wavenet
источник

V

Vlad in Распознавание речи
Но wavenet же уступает по качеству такотрону
источник

VK

Viacheslav Klimkov in Распознавание речи
Они не распространяются что за причина такого решения. Политиканство, не иначе
источник

V

Vlad in Распознавание речи
Судя по статье, у них только в 1 предложении было пропущено слово и 6 неправильных произношений

Я думал хуже будет)
источник

V

Vlad in Распознавание речи
А русскоязычной адаптации этого теста нету?
источник

VK

Viacheslav Klimkov in Распознавание речи
Не знаю. Такотрон есть в продакшн у других компаний. Можно заставить работать но нужно потрудиться
источник

V

Vlad in Распознавание речи
А вы его не обучали сами?
Прямые конкуренты моего заказчика вот недавно обучили и запустили базовый вариант такотрон2 и там прям очень хорошее на слух качество
источник

V

Vlad in Распознавание речи
источник

V

Vlad in Распознавание речи
Вот
источник

V

Vlad in Распознавание речи
Но та демка, что админ скинул, звучит лучше, но частоту дискретизации надо повышать
источник

V

Vlad in Распознавание речи
Проблем с интонацией конечно куча, но в целом приятно
источник

VK

Viacheslav Klimkov in Распознавание речи
Качество хорошее, и будет работать в 99% процентов случаев. Вы спросили про нюансы, вот такой есть.
источник