Size: a a a

Распознавание речи

2017 December 07

NS

Nikolay Shmyrev in Распознавание речи
gstreamer сервер бяка
источник

NK

ID:397962875 in Распознавание речи
?!
источник

NK

ID:397962875 in Распознавание речи
Nikolay Shmyrev
gstreamer сервер бяка
А есть лучше решения?
источник

NS

Nikolay Shmyrev in Распознавание речи
Есть
источник

NK

ID:397962875 in Распознавание речи
подскажите?
источник

NS

Nikolay Shmyrev in Распознавание речи
источник

NS

Nikolay Shmyrev in Распознавание речи
gstreamer не умеет модели разделять между потоками, памяти очень много расходуется
источник

t2

tonko 22 in Распознавание речи
Николай, а на каких данных обучалась ваша модель с tdnn и производилась ли оптимизация параметров обучения? Прогнал ее недавно на своем датасете - точность не очень большая. Пока что думаю сократить словарь, я так понимаю там для предсказания используется соварь из 545к слов.
источник

NS

Nikolay Shmyrev in Распознавание речи
попробуйте сократить
источник

t2

tonko 22 in Распознавание речи
Работаю над этим сейчас
источник

NS

Nikolay Shmyrev in Распознавание речи
Отлично, держите нас в курсе!
источник

NK

ID:397962875 in Распознавание речи
В нем так же присуствует разпознавание "налету"?
источник
2017 December 08

NK

ID:397962875 in Распознавание речи
Я никак не могу разобраться как туда вставить kaldi-ru-0.3
источник

NS

Nikolay Shmyrev in Распознавание речи
скопировать файлы с теми же именами поверх английских
источник

NK

ID:397962875 in Распознавание речи
Я так и сделал, получаю ошибку
источник

NK

ID:397962875 in Распознавание речи
Ivector feature dimension mismatch: got -1 but network expects 30
источник

NS

Nikolay Shmyrev in Распознавание речи
Вот сюда https://github.com/achernetsov/asr-server/blob/master/src/FcgiDecodingApp.cc#L165 надо добавить --ivector-extraction-config=exp/tdnn/conf/ivector_extractor.conf
источник

NS

Nikolay Shmyrev in Распознавание речи
Ну и пути в файлах должны быть чётко прописаны
источник

NK

ID:397962875 in Распознавание речи
Как я понял, теперь нужно все исходники переделать под 8кГц?
источник

NS

Nikolay Shmyrev in Распознавание речи
В одном месте поменять
источник