Size: a a a

Распознавание речи

2019 April 11

NS

Nikolay Shmyrev in Распознавание речи
sgmm давно уже не актуально
источник

ДТ

Дмитрий Терехин in Распознавание речи
Судя по ошибкам, основные:
tri2b/log/acc.26.5.log:WARNING (gmm-acc-stats-ali[5.5.274~3-58453]:main():gmm-acc-stats-ali.cc:79) No alignment for utterance 670-670-8057
tri2b/log/align.10.2.log:WARNING (gmm-align-compiled[5.5.274~3-58453]:AlignUtteranceWrapper():decoder-wrappers.cc:501) Retrying utterance 141-141-1415 with beam 40
tri2b/log/lda_acc.2.log:WARNING (acc-lda[5.5.274~3-58453]:main():acc-lda.cc:77) No posteriors for utterance 298-298-2984
tri3b_ali_train_clean_5/log/fmllr.5.log:WARNING (gmm-est-fmllr-gpost[5.5.274~3-58453]:main():gmm-est-fmllr-gpost.cc:116) Did not find posteriors for utterance 676-676-8328
источник

t2

tonko 22 in Распознавание речи
Похоже что с фортматом языковой что-то не так
источник

ДТ

Дмитрий Терехин in Распознавание речи
Забыл указать, что в качестве 3-gram.arpa.tar.gz, 3-gram.pruned.1e-7.arpa.gz, и 3-gram.pruned.3e-7.arpa.gz используется один и тот же ru.lm из  zero_ru_cont_8k_v3
источник

ДТ

Дмитрий Терехин in Распознавание речи
Может быть в этом дело?
источник

t2

tonko 22 in Распознавание речи
Откройте и посмотрите разницу а содержимос
источник

t2

tonko 22 in Распознавание речи
Между ru.lm и какой-нибудь из .arpa, например
источник

ДТ

Дмитрий Терехин in Распознавание речи
Спасибо, завтра посмотрю и попробую это исправить
источник

NS

Nikolay Shmyrev in Распознавание речи
Дмитрий Терехин
Судя по ошибкам, основные:
tri2b/log/acc.26.5.log:WARNING (gmm-acc-stats-ali[5.5.274~3-58453]:main():gmm-acc-stats-ali.cc:79) No alignment for utterance 670-670-8057
tri2b/log/align.10.2.log:WARNING (gmm-align-compiled[5.5.274~3-58453]:AlignUtteranceWrapper():decoder-wrappers.cc:501) Retrying utterance 141-141-1415 with beam 40
tri2b/log/lda_acc.2.log:WARNING (acc-lda[5.5.274~3-58453]:main():acc-lda.cc:77) No posteriors for utterance 298-298-2984
tri3b_ali_train_clean_5/log/fmllr.5.log:WARNING (gmm-est-fmllr-gpost[5.5.274~3-58453]:main():gmm-est-fmllr-gpost.cc:116) Did not find posteriors for utterance 676-676-8328
Это не критичные ошибки. Скорее всего ru.lm забылы в gz запаковать. На стадии обработки lm должны быть критичные ошибки.
источник
2019 April 12

IB

Ilya Barkalov in Распознавание речи
Привет всем, подскажите пожалуйста утилку для улучшения качества аудио или оптимальные настройки в какой-нибудь из программ, куда можно загнать 1000 файлов с примерно одним и тем же качеством
источник

NS

Nikolay Shmyrev in Распознавание речи
источник

M

Mark I in Распознавание речи
Здравствуйте, есть ли какая нибудь база голосов, для тестирования распознавания читателя по звуку?
источник

NS

Nikolay Shmyrev in Распознавание речи
источник

NS

Nikolay Shmyrev in Распознавание речи
источник

t2

tonko 22 in Распознавание речи
Блин, только думал с этой идеей пойти к @nshmyrev, а уже кто-то успел раньше https://arxiv.org/abs/1904.05862
источник

t2

tonko 22 in Распознавание речи
Ну чтож, попытаемся довести это до рынка, начать конечно стоит с бенчмарка на русских данных
источник

t2

tonko 22 in Распознавание речи
Я уже это выбрал как тему для аспирантской
источник

t2

tonko 22 in Распознавание речи
Работы, думаю, еще много там. Т.к. бенчмарк на лишь одном датасете
источник

NS

Nikolay Shmyrev in Распознавание речи
Facebook как всегда сравнивает тёплое с мягким
источник

NS

Nikolay Shmyrev in Распознавание речи
У lattice-free MMI 2.8 при тренировке только на WSJ
источник