Size: a a a

Распознавание речи

2019 March 18

NS

Nikolay Shmyrev in Распознавание речи
Шанс есть, почему бы нет. Модель нужно тренировать отдельно. Декодировать звук надо.
источник

A

Artyom in Распознавание речи
Ну он где-то совсем на пределе сжатия, а по одной из шкал ещё и на пределе человеческого восприятия. Спасибо!
источник

NS

Nikolay Shmyrev in Распознавание речи
2.4kbps у кодеков вроде lpc10, там нормальное доволно качество. Предел около 300bps с нейросетями, есть MELPe 600bps
источник

NS

Nikolay Shmyrev in Распознавание речи
источник

NS

Nikolay Shmyrev in Распознавание речи
кто будет завтра можно пересечься http://ccwf.ru
источник
2019 March 19

A

Artyom in Распознавание речи
Ну вот DSPINI про TWELP даже на сайте пишет much better speech quality in comparison with ... AMBE+2. Но Вы нас обнадежили, спасибо!
источник
2019 March 22

AO

Andrei Obyortyshev in Распознавание речи
Привет. Подскажите, пожалуйста, как использовать русскую модель kaldi для распознавания с микрофона? Я вижу в kaldi массу бинарников, но я в них немного потерялся. Нужно использовать один из них, или смотреть в сторону https://github.com/alumae/kaldi-gstreamer-server вообще?
источник

NS

Nikolay Shmyrev in Распознавание речи
источник

NS

Nikolay Shmyrev in Распознавание речи
можно попробовать
источник

AO

Andrei Obyortyshev in Распознавание речи
Спасибо
источник

NS

Nikolay Shmyrev in Распознавание речи
https://github.com/kaldi-asr/kaldi/pull/2938 ещё вчера залили, там самая правильная реализация декодирования должна быть.
источник
2019 March 29

ММ

Мария Мамонова in Распознавание речи
здравствуйте
есть приложение с pocketsphinx на python для распознавания определенного блока команд. сейчас качество распознавания неплохое, но только если среда бесшумная. если же есть шумы, то качество резко падает. подскажите, как можно сделать его более шумоустойчивым? есть ли какие донастройки?
источник

ап

алексей пономаренко in Распознавание речи
Нужно решать вопрос с обработкой входящего сигнала, например отсекать то что не является голосом.
источник

t2

tonko 22 in Распознавание речи
Можно по фурье диапазон голоса вырезать
источник
2019 March 30

LV

Leo V in Распознавание речи
полагаю, так и работает)
источник
2019 April 02

IB

Ilya Barkalov in Распознавание речи
🙋🏻‍♂️
источник

NS

Nikolay Shmyrev in Распознавание речи
Привет
источник
2019 April 03

A

Artyom in Распознавание речи
Добрый день! Пытаемся экспериментировать с моделью kaldi-ru-0.6.tar.gz от alphacephei, но есть одна большая проблема: она обучена на нормальных звуковых файлах, а у нам нужно тоже самое, но после lowband кодека. Есть ли возможность её апаптировать или получить доступ к исходным файлам и попытаться переобучить?
источник

NS

Nikolay Shmyrev in Распознавание речи
Artyom
Добрый день! Пытаемся экспериментировать с моделью kaldi-ru-0.6.tar.gz от alphacephei, но есть одна большая проблема: она обучена на нормальных звуковых файлах, а у нам нужно тоже самое, но после lowband кодека. Есть ли возможность её апаптировать или получить доступ к исходным файлам и попытаться переобучить?
Можно просто на своих данных научить
источник

A

Artyom in Распознавание речи
А какой из egs лучше взять за основу?
источник