Телеграмм чат группы cmusphinx

Сергей, легче было в "нашей группе". Я там это тоже выкладывал. Шум я называю фоновыми звуками - телевизор, гул дороги. То есть частоты как таковой нет - в широком спектре.

источник

10:54пожаловаться #6

СК

Сергей Кушеев in Распознавание речи

Алексей Ефремов

Это понятно, нужна частота этого шума, чтобы понять о возможности образать аппаратно

источник

10:55пожаловаться #7

СК

Сергей Кушеев in Распознавание речи

Вообще при тестировании интересно кто через какие микрофоны говорит

источник

10:55пожаловаться #8

АЕ

Алексей Ефремов in Распознавание речи

Я из своих 6 штук (в том числе один WM-60) выбрал 2 шт. Один нонейм, у другого название гляну вечером. А вообще есть смысл оставлять диапазон 300-3400 Гц. Правда если делать Voice ID, то скорее всего диапазон должен быть больше. В CMU Sphinx по умолчанию частота дискретизации 16000Гц.

источник

11:01пожаловаться #9

Veniamin Gvozdikov in Распознавание речи

@nshmyrev что-то у меня не выходит запустить вашу модель в asr-kald.

ERROR (fcgi-nnet3-decoder[5.3.98~1-3031]:ReadConfigFile():parse-options.cc:469) Cannot open config file: mfcc.conf

источник

14:28пожаловаться #10

Artyom Chernetsov in Распознавание речи

там в decode.sh пути захардкожены, надо на свои поменять

источник

14:44пожаловаться #11

Veniamin Gvozdikov in Распознавание речи

Artyom Chernetsov

там в decode.sh пути захардкожены, надо на свои поменять

Спасибо, сейчас попробую

источник

14:46пожаловаться #12

Veniamin Gvozdikov in Распознавание речи

Artyom Chernetsov

там в decode.sh пути захардкожены, надо на свои поменять

http://dpaste.com/3MEDDJ6 вот что произошло, когда попытался залить файл который лежал в том же каталоге где и модель

vg@localhost:~/kaldi/kaldi-ru-0.4$ curl -H "Content-Type: application/octet-stream" --data-binary  @decoder-test.wav http://localhost/asr
{"status":"error","data":[{"text":""}]}

источник

15:20пожаловаться #13

Nikolay Shmyrev in Распознавание речи

ivector-config надо добавить

источник

18:02пожаловаться #14

Veniamin Gvozdikov in Распознавание речи

Nikolay Shmyrev

ivector-config надо добавить

это какой-то параметр?

источник

18:05пожаловаться #15