Size: a a a

Распознавание речи

2017 September 11

LV

Leo V in Распознавание речи
слабовата?
источник

LV

Leo V in Распознавание речи
я просто всё хочу закончить голосовое управление для компа чтобы можно было попросить музыку поставить, а потом выключить
источник

NS

Nikolay Shmyrev in Распознавание речи
надо matrix one купить для разделения направлений
источник

LV

Leo V in Распознавание речи
я так понимаю, параллельно с музыкой где есть слова, работать не будет
источник

LV

Leo V in Распознавание речи
ща прогуглю сколько стоит
источник

NS

Nikolay Shmyrev in Распознавание речи
источник

LV

Leo V in Распознавание речи
ща попробую заказать. я не могу на их сайте найти конкретные ответы "вот ссылка для софта". "вот данные с микрофона будут такими"
источник

LV

Leo V in Распознавание речи
самостоятельно HARK я не настрою http://www.hark.jp/document/1.2.0/hark-cookbook-en/sec-MicrophoneArray.html
источник

LV

Leo V in Распознавание речи
в общем, если будет митап, я точно +1
источник

LV

Leo V in Распознавание речи
заказать можно. завтра попробую
источник

VG

Veniamin Gvozdikov in Распознавание речи
Nikolay Shmyrev
kaldi надо самый последний
Только что собрал с самой последней (134cf7ee5c9604a431080db14cf6dc19f6524047):
ERROR: FstImpl::ReadHeader: FST not of type vector: <unspecified>
ERROR (fcgi-nnet3-decoder[5.2.126~1-134cf7]:ReadFstKaldi():kaldi-fst-io.cc:40) Could not read fst from HCLG.fst
источник

NS

Nikolay Shmyrev in Распознавание речи
надо в коде поменять ReadFstKaldi на ReadFstKaldiGeneric
источник

NS

Nikolay Shmyrev in Распознавание речи
источник

VG

Veniamin Gvozdikov in Распознавание речи
Спасибо, запустилось
источник

VG

Veniamin Gvozdikov in Распознавание речи
А как правильно сконвертировать аудио файл? Я делал
ffmpeg -i audio.wav -f s16le -ar 8000 -ac 1 audio.raw

Но kaldi все же говорти мне:
ERROR (fcgi-nnet3-decoder[5.2.126~1-134cf7]:AcceptWaveform():online-feature.cc:45) Sampling frequency mismatch, expected 8000, got 16000

[ Stack-Trace: ]
./asr-server/fcgi-nnet3-decoder() [0xf393dc]
kaldi::MessageLogger::HandleMessage(kaldi::LogMessageEnvelope const&, char const*)
kaldi::MessageLogger::~MessageLogger()
kaldi::OnlineGenericBaseFeature<kaldi::MfccComputer>::AcceptWaveform(float, kaldi::VectorBase<float> const&)
kaldi::OnlineNnet2FeaturePipeline::AcceptWaveform(float, kaldi::VectorBase<float> const&)
apiai::Nnet3LatgenFasterDecoder::AcceptWaveform(float, kaldi::VectorBase<float> const&, bool)
apiai::OnlineDecoder::Decode(apiai::Request&, apiai::Response&)
apiai::FcgiDecodingApp::ProcessingRoutine(apiai::Decoder&)
apiai::FcgiDecodingApp::Run(int, char**)
main
__libc_start_main
_start
источник

NS

Nikolay Shmyrev in Распознавание речи
в исходниках надо 16000 на 8000 поменять
источник

VG

Veniamin Gvozdikov in Распознавание речи
Ага, теперь надо уже разобраться почему пустота.
источник

VG

Veniamin Gvozdikov in Распознавание речи
Если кому-то надо, вот патчик для asr-server https://dpaste.de/NC80
источник
2017 September 17

U

Usman in Распознавание речи
ява выдает грит что памяти не хватает
дал 2 гига heap такая же ошибка
что делать
источник

U

Usman in Распознавание речи
есть ли pocketsphinx под яву
источник