Size: a a a

Распознавание речи

2019 July 22

a

agic in Распознавание речи
Igor Ishin
Возможно глупый вопрос, а как тексты режутся под куски аудио?
я ответил выше, мне это неизвестно
источник

V

Vlad in Распознавание речи
Там есть алгоритмы, которые транскрибируют
источник

V

Vlad in Распознавание речи
Так текст субтитров сводят с аудиодорожкой по таймингам
источник

V

Vlad in Распознавание речи
Для этого надо сам текст и аудио
источник

a

agic in Распознавание речи
вот и ответ )
источник

V

Vlad in Распознавание речи
Я просто раньше тоже думал о таком способе надыбать данных для обучения синтеза речи, почти нашёл готовое решение, но мне запретили, ибо нужно покупать лецензию у издательства аудиокниги, что мол они не против использования голосов их дикторов для нашего синтеза речи)
источник

a

agic in Распознавание речи
Мы для распознавания
источник

II

Igor Ishin in Распознавание речи
Николай, доброго вечера, подскажите пожалуйста. Аудио файл 8к и тот же файл, преобразованный с помощью ffmpeg в 16к. При этом 16к, в первом приближении, распознает лучше. Проверял на Вашей модели.
источник

NS

Nikolay Shmyrev in Распознавание речи
не бывает такого, разницы быть не должно
источник

NS

Nikolay Shmyrev in Распознавание речи
16k всё равно в 8 преобразуется
источник

II

Igor Ishin in Распознавание речи
Nikolay Shmyrev
не бывает такого, разницы быть не должно
ну тут либо я гдето затупил, либо бывает))
источник

NS

Nikolay Shmyrev in Распознавание речи
Если будет дополнительная инфрмация могу посмотреть
источник

NS

Nikolay Shmyrev in Распознавание речи
Vlad
Я просто раньше тоже думал о таком способе надыбать данных для обучения синтеза речи, почти нашёл готовое решение, но мне запретили, ибо нужно покупать лецензию у издательства аудиокниги, что мол они не против использования голосов их дикторов для нашего синтеза речи)
А зря запретили, голоса потом подкручивать можно 😉
источник

t2

tonko 22 in Распознавание речи
Nikolay Shmyrev
А зря запретили, голоса потом подкручивать можно 😉
В плане что аугментированные голоса не облагаются лицензией?
источник
2019 July 23

AZ

Al Zatv in Распознавание речи
Это ж как с автомобилем. Если украл и успел перекрасить — значит твоя, по закону.
источник

NS

Nikolay Shmyrev in Распознавание речи
вот кстати статейка на тему http://eprints.gla.ac.uk/159231/7/159231.pdf
источник

VK

Viacheslav Klimkov in Распознавание речи
источник

VK

Viacheslav Klimkov in Распознавание речи
интересно воспроизведет ли ттс вотермарки
источник

NS

Nikolay Shmyrev in Распознавание речи
источник

VK

Viacheslav Klimkov in Распознавание речи
неплохой выбор голоса. нравится
источник