Size: a a a

Распознавание речи

2018 January 29

VG

Veniamin Gvozdikov in Распознавание речи
Artyom Chernetsov
там в decode.sh пути захардкожены, надо на свои поменять
http://dpaste.com/2FK3AT5 вот ещё добавил, запускается на kaldi-ru-0.2 но ничего не распознаёт. Хотя файлы распознаются скриптом на kaldi-ru-0.4
источник

VG

Veniamin Gvozdikov in Распознавание речи
Для kaldi-ru-0.4 надо ivecotor-config как выше Николай сказал, для этого надо что-то доработать в asr-server
источник
2018 January 30

t2

tonko 22 in Распознавание речи
Чем посоветуете фильтровать шумы ?
источник

t2

tonko 22 in Распознавание речи
Какие-то конкретные методы/библиотеки под python3
источник

NS

Nikolay Shmyrev in Распознавание речи
Лучше не фильтровать
источник

t2

tonko 22 in Распознавание речи
Как еще порекомендуете повысить точность распознавания? Пользуюсь 0.4 моделью, записи весьма грязные
источник

NS

Nikolay Shmyrev in Распознавание речи
Записывать в хорошем качестве
источник

t2

tonko 22 in Распознавание речи
На фильтрацию рассчитывать не стоит?
источник

NS

Nikolay Shmyrev in Распознавание речи
Нет
источник
2018 January 31

VG

Veniamin Gvozdikov in Распознавание речи
@nshmyrev А кстати про ivector-config, это как-то дописать необходимо asr-server, но куда идти откуда начать что бы доделать?
источник

NS

Nikolay Shmyrev in Распознавание речи
там же где --mfcc-config=exp/tdnn/conf/mfcc.conf дописать --ivector-extraction-config=exp/tdnn/conf/ivector_extractor.conf
источник

VG

Veniamin Gvozdikov in Распознавание речи
Я про asr-server, там С++, а не конфиг
источник

NS

Nikolay Shmyrev in Распознавание речи
источник

VG

Veniamin Gvozdikov in Распознавание речи
Сейчас попробую, спасибо
источник

VG

Veniamin Gvozdikov in Распознавание речи
Запустилось все, но какая-то другая проблема, ни ошибок ничего просто пустоту вовращает не распазнает
источник

NS

Nikolay Shmyrev in Распознавание речи
источник

NS

Nikolay Shmyrev in Распознавание речи
вот тут ещё надо поменять
источник

VG

Veniamin Gvozdikov in Распознавание речи
Veniamin Gvozdikov
http://dpaste.com/2FK3AT5 вот ещё добавил, запускается на kaldi-ru-0.2 но ничего не распознаёт. Хотя файлы распознаются скриптом на kaldi-ru-0.4
Я вот так менял, но не помогло
источник

VG

Veniamin Gvozdikov in Распознавание речи
[{"confidence":0.851283,"text":""}] всегда такое содержимое, даже с файлом что в поставке модели идет
источник

VG

Veniamin Gvozdikov in Распознавание речи

$ curl -H "Content-Type: application/octet-stream" --data-binary @decoder-test.wav 'http://localhost/asr?interrupted=endofspeech'
{"status":"ok","data":[{"confidence":0.85124,"text":""}],"interrupted":"endofspeech","time":1080}

Всегда такое возвращает
источник