Телеграмм чат группы cmusphinx

Size: a a a

Распознавание речи

225 membersпожаловаться на группу

2019 April 11

Nikolay Shmyrev in Распознавание речи

sgmm давно уже не актуально

источник

10:17пожаловаться #1

ДТ

Дмитрий Терехин in Распознавание речи

Судя по ошибкам, основные:

tri2b/log/acc.26.5.log:WARNING (gmm-acc-stats-ali[5.5.274~3-58453]:main():gmm-acc-stats-ali.cc:79) No alignment for utterance 670-670-8057

tri2b/log/align.10.2.log:WARNING (gmm-align-compiled[5.5.274~3-58453]:AlignUtteranceWrapper():decoder-wrappers.cc:501) Retrying utterance 141-141-1415 with beam 40

tri2b/log/lda_acc.2.log:WARNING (acc-lda[5.5.274~3-58453]:main():acc-lda.cc:77) No posteriors for utterance 298-298-2984

tri3b_ali_train_clean_5/log/fmllr.5.log:WARNING (gmm-est-fmllr-gpost[5.5.274~3-58453]:main():gmm-est-fmllr-gpost.cc:116) Did not find posteriors for utterance 676-676-8328

источник

10:28пожаловаться #2

tonko 22 in Распознавание речи

Похоже что с фортматом языковой что-то не так

источник

10:35пожаловаться #3

ДТ

Дмитрий Терехин in Распознавание речи

Забыл указать, что в качестве 3-gram.arpa.tar.gz, 3-gram.pruned.1e-7.arpa.gz, и 3-gram.pruned.3e-7.arpa.gz используется один и тот же ru.lm из zero_ru_cont_8k_v3

источник

10:38пожаловаться #4

ДТ

Дмитрий Терехин in Распознавание речи

Может быть в этом дело?

источник

10:38пожаловаться #5

tonko 22 in Распознавание речи

Откройте и посмотрите разницу а содержимос

источник

10:39пожаловаться #6

tonko 22 in Распознавание речи

Между ru.lm и какой-нибудь из .arpa, например

источник

10:40пожаловаться #7

ДТ

Дмитрий Терехин in Распознавание речи

Спасибо, завтра посмотрю и попробую это исправить

источник

10:40пожаловаться #8

Nikolay Shmyrev in Распознавание речи

Дмитрий Терехин

Судя по ошибкам, основные:

tri2b/log/acc.26.5.log:WARNING (gmm-acc-stats-ali[5.5.274~3-58453]:main():gmm-acc-stats-ali.cc:79) No alignment for utterance 670-670-8057

tri2b/log/align.10.2.log:WARNING (gmm-align-compiled[5.5.274~3-58453]:AlignUtteranceWrapper():decoder-wrappers.cc:501) Retrying utterance 141-141-1415 with beam 40

tri2b/log/lda_acc.2.log:WARNING (acc-lda[5.5.274~3-58453]:main():acc-lda.cc:77) No posteriors for utterance 298-298-2984

tri3b_ali_train_clean_5/log/fmllr.5.log:WARNING (gmm-est-fmllr-gpost[5.5.274~3-58453]:main():gmm-est-fmllr-gpost.cc:116) Did not find posteriors for utterance 676-676-8328

Это не критичные ошибки. Скорее всего ru.lm забылы в gz запаковать. На стадии обработки lm должны быть критичные ошибки.

источник

10:42пожаловаться #9

2019 April 12

Ilya Barkalov in Распознавание речи

Привет всем, подскажите пожалуйста утилку для улучшения качества аудио или оптимальные настройки в какой-нибудь из программ, куда можно загнать 1000 файлов с примерно одним и тем же качеством

источник

12:31пожаловаться #10

Nikolay Shmyrev in Распознавание речи

https://github.com/nsu-ai-team/noise_supression

GitHub

nsu-ai-team/noise_supression

Python package for noise supression in audio based on DNN - nsu-ai-team/noise_supression