Size: a a a

Распознавание речи

2019 November 05

VK

Viacheslav Klimkov in Распознавание речи
если бы шумоподавление решало проблемы вокодеров то мы бы остановились на world ;)
источник

KY

Kim Young in Распознавание речи
Vlad
По первому впечатлению - только в скорости работы. Всякие logmmse по скорости даже рядом не стоят. На моём i5 RNNoise даёт примерно 25 реалтаймов, а logmmse сильно меньше
Просто если рассматривать vst и какой-нибудь шумоподавитель от Waves или FabFilter, то на том же i5 работает просто прекрасно в реальном времени
источник

V

Vlad in Распознавание речи
Примеры его работы можно посмотреть в моём репо с обёрткой для использования RNNoise из питона: https://github.com/Desklop/RNNoise_Wrapper

Кстати, @snakers41 - вам большое спасибо) На основе вашего ишью из официального репо RNNoise я сделал этот пакет
источник

V

Vlad in Распознавание речи
Kim Young
Просто если рассматривать vst и какой-нибудь шумоподавитель от Waves или FabFilter, то на том же i5 работает просто прекрасно в реальном времени
А можете ссылки дать? Я сравню на досуге, ибо пока что тема для меня актуальна, т.к. RNNoise убирает не все шумы, которые хотелось бы
источник

KY

Kim Young in Распознавание речи
Vlad
А можете ссылки дать? Я сравню на досуге, ибо пока что тема для меня актуальна, т.к. RNNoise убирает не все шумы, которые хотелось бы
Вам на лицензию или рутрекер?)
источник

V

Vlad in Распознавание речи
Viacheslav Klimkov
если бы шумоподавление решало проблемы вокодеров то мы бы остановились на world ;)
Смотрите, если судить по приведённому выше примеру с жужжанием LPCnet, то такое жужжание легко уберёт RNNoise)
источник

V

Vlad in Распознавание речи
Kim Young
Вам на лицензию или рутрекер?)
Лицензию, рутрекер "зло"))
источник

KY

Kim Young in Распознавание речи
Vlad
Лицензию, рутрекер "зло"))
источник

VK

Viacheslav Klimkov in Распознавание речи
Vlad
Смотрите, если судить по приведённому выше примеру с жужжанием LPCnet, то такое жужжание легко уберёт RNNoise)
покажите ;) покажите MOS. будет убойная статья на interspeech.
источник

KY

Kim Young in Распознавание речи
Vlad
Лицензию, рутрекер "зло"))
источник

V

Vlad in Распознавание речи
Viacheslav Klimkov
покажите ;) покажите MOS. будет убойная статья на interspeech.
MOS считать я не умею))
источник

V

Vlad in Распознавание речи
источник

V

Vlad in Распознавание речи
Это прогнанный пример работы LPCnet через RNNoise
источник

V

Vlad in Распознавание речи
Шумов лично я не слышу, кроме "дребезжания" голоса
источник

V

Vlad in Распознавание речи
Это оригинал
источник

VK

Viacheslav Klimkov in Распознавание речи
как по мне то одинаково неоч. и это при том что пример ljspeech
источник

V

Vlad in Распознавание речи
сам голос "дребезжит", а это никакой дополнительной постобработкой не убрать
источник

V

Vlad in Распознавание речи
хотя это намного лучше, чем вообще без вокодера (или его алгоритмичного варианта, не помню как называется)
источник

VK

Viacheslav Klimkov in Распознавание речи
голос не дребезжит, вокодер дребезжит (жужжит или еще что). лучше чем world но намного ли..не сказал бы. а самое главное попробуйте кому то скормить такое когда у конкурентов отлично работающие wavenet-ы
источник

V

Vlad in Распознавание речи
У меня тут возник довольно странный вопрос: а кто-нибудь случайно не пробовал запускать Tacotron2+WaveNet/WaveGlow на мобилках ios/android?
источник