Size: a a a

Распознавание речи

2018 March 06

MW

Mohammad Wolf in Распознавание речи
Просто я работал на винде
источник

MW

Mohammad Wolf in Распознавание речи
Собрал библиотеку kaldi целый час
источник

MW

Mohammad Wolf in Распознавание речи
Но все равно оставались 2-3 ошибки. В документации по ней типа написали:
"Если хотите ее использовать для винды, то разбирайтесь сами. Мы не поддерживаем в этой платформе"
источник

MW

Mohammad Wolf in Распознавание речи
Сейчас я уже и на линуксе, и на винде
источник

NS

Nikolay Shmyrev in Распознавание речи
Ну да, так и есть, линукс нужен
источник

MW

Mohammad Wolf in Распознавание речи
Nikolay Shmyrev
Ну да, так и есть, линукс нужен
А ты использовал kaldi?
источник

MW

Mohammad Wolf in Распознавание речи
Можешь о ней что-то сказать?
источник

S

Sotneo in Распознавание речи
Почитайте открытые источники, есть сравнения(в том чилсе и точность); почитайте хотя бы историю этого чата. Будете в курсе.
источник

MW

Mohammad Wolf in Распознавание речи
Ну ладно. Мучать вас не буду. Просто хотел узнать ваши отзывы о ней
источник

P

Pavel in Распознавание речи
Ребят, а как timestamp выводить возле каждого слова в kaldi?
источник

NS

Nikolay Shmyrev in Распознавание речи
смотря какой интерфейс использовать
источник

P

Pavel in Распознавание речи
online2-wav-nnet3-latgen-faster
источник

NS

Nikolay Shmyrev in Распознавание речи
online2-wav-nnet3-latgen-faster \
     --word-symbol-table=exp/tdnn/graph/words.txt --frame-subsampling-factor=3 --frames-per-chunk=51 \
     --acoustic-scale=1.0 --beam=12.0 --lattice-beam=6.0 --max-active=10000 \
     --config=exp/tdnn/conf/online.conf \
     exp/tdnn/final.mdl exp/tdnn/graph/HCLG.fst ark:decoder-test.utt2spk scp:decoder-test.scp ark:- |
   lattice-lmrescore --lm-scale=-1.0 ark:- 'fstproject --project_output=true data/lang_test_rescore/G.fst |' ark:- |
   lattice-lmrescore-const-arpa ark:- data/lang_test_rescore/G.carpa ark:- |
   lattice-1best --acoustic-scale=0.08333 ark:- ark,t:- |
   lattice-align-words data/lang_test_rescore/phones/word_boundary.int exp/tdnn/final.mdl ark:- ark:- |
   nbest-to-ctm ark:- - |
   local/int2sym.pl -f 5 data/lang_test_rescore/words.txt - -
источник

NS

Nikolay Shmyrev in Распознавание речи
Это из прикреплённого сверху сообщения между прочим
источник

NS

Nikolay Shmyrev in Распознавание речи
правда должно быть nbest-to-ctm --frame-shift=0.03 ark:- -, тогда времена будут правильные
источник

P

Pavel in Распознавание речи
спасибо, попробую
источник
2018 March 13

K

Kai in Распознавание речи
Всем привет! Может ли кто-нибудь сказать мне, что означает path score? (ps_get_hyp () http://www.speech.cs.cmu.edu/sphinx/doc/doxygen/pocketsphinx/pocketsphinx_8h.html#e4130fef938568440c014abae0e4de5e) полезен ли он как показатель надежности?
источник

NS

Nikolay Shmyrev in Распознавание речи
Kai
Всем привет! Может ли кто-нибудь сказать мне, что означает path score? (ps_get_hyp () http://www.speech.cs.cmu.edu/sphinx/doc/doxygen/pocketsphinx/pocketsphinx_8h.html#e4130fef938568440c014abae0e4de5e) полезен ли он как показатель надежности?
Бесполезен
источник

K

Kai in Распознавание речи
Спасибо за ответ! Существует ли что-то полезное?
источник

NS

Nikolay Shmyrev in Распознавание речи
ps_get_prob
источник