Size: a a a

Распознавание речи

2019 April 21

M

Mark I in Распознавание речи
Здравстуйте. Я сделал, но не понимаю с какого этапа нужно продолжать. Тренирую на mini_librispeech
источник
2019 April 22

NS

Nikolay Shmyrev in Распознавание речи
Сразу после make_mfcc.sh
источник
2019 April 25

II

Igor Ishin in Распознавание речи
Доброго всем дня, пробовал запустить mini_librispeech, но на последнем этапе вылетает такая ошибка. Можете посоветовать что с этим можно сделать?
источник

NS

Nikolay Shmyrev in Распознавание речи
Igor Ishin
Доброго всем дня, пробовал запустить mini_librispeech, но на последнем этапе вылетает такая ошибка. Можете посоветовать что с этим можно сделать?
В логе exp/chain/tdnn1h_s/egs/log посмотреть надо, либо памяти не хватило, либо места на диске
источник

II

Igor Ishin in Распознавание речи
Nikolay Shmyrev
В логе exp/chain/tdnn1h_s/egs/log посмотреть надо, либо памяти не хватило, либо места на диске
Благодарю, сейчас не могу посмотреть, но склоняюсь к тому что оперативки не хватило, run.pl -- mem 2G отвечает за память? Я искал информацию, но пока не преуспел. И можно ли справиться с этой задачей 16gb ram?
источник

NS

Nikolay Shmyrev in Распознавание речи
--mem 2G это просто подсказка для запуска на кластере, в run.pl не используется. 16gb справится, надо только может быть число потоков уменьшить.
источник

II

Igor Ishin in Распознавание речи
Nikolay Shmyrev
--mem 2G это просто подсказка для запуска на кластере, в run.pl не используется. 16gb справится, надо только может быть число потоков уменьшить.
Благодарю, продолжу изыскания)
источник

NS

Nikolay Shmyrev in Распознавание речи
в run_tdnn num_jobs_initial num_jobs_final нужно тоже поменять в соответствии с числом карт
источник
2019 April 27

M

Mark I in Распознавание речи
Здравствуйте. У меня пару проблем.
1) Когда я пытаюсь по https://deepakbaby.github.io/post/kaldi-custom-features/ поставить просто MFCC от python_speech_features (библотека), то получается такое, что новые признаки имеют на 1 больше чем на fbank

2) Допустим, что я срезал с конца один вектор. Нужно ли мне делать steps/train_mono? Я делаю, получаю ошибку ERROR (gmm-init-mono[5.5.296~1-299b1]:main():gmm-init-mono.cc:113) bad variance

Работаю на librispeech
источник
2019 April 28

NS

Nikolay Shmyrev in Распознавание речи
Mark I
Здравствуйте. У меня пару проблем.
1) Когда я пытаюсь по https://deepakbaby.github.io/post/kaldi-custom-features/ поставить просто MFCC от python_speech_features (библотека), то получается такое, что новые признаки имеют на 1 больше чем на fbank

2) Допустим, что я срезал с конца один вектор. Нужно ли мне делать steps/train_mono? Я делаю, получаю ошибку ERROR (gmm-init-mono[5.5.296~1-299b1]:main():gmm-init-mono.cc:113) bad variance

Работаю на librispeech
1) ну и что, всё равно модель нужно заново тренировать
2) срезать не нужно, train_mono - зависит от признаков, почти всегда нужно, но можно и начать с выравнивания какого-нибудь существующего с новыми признаками
3) bad_variance видимо из-за нулей в признаках везде, такого быть не должно.
источник

II

Igor Ishin in Распознавание речи
Nikolay Shmyrev
в run_tdnn num_jobs_initial num_jobs_final нужно тоже поменять в соответствии с числом карт
весьма благодарен, это помогло продвинутся дальше. Попробовал сделать как у Вас, но результат нулевой пока, взял запись из corpus, конвертнул в wav.
источник

NS

Nikolay Shmyrev in Распознавание речи
Igor Ishin
весьма благодарен, это помогло продвинутся дальше. Попробовал сделать как у Вас, но результат нулевой пока, взял запись из corpus, конвертнул в wav.
Входных данных тут не было
источник

II

Igor Ishin in Распознавание речи
подкидывал этот файл
источник

NS

Nikolay Shmyrev in Распознавание речи
decoder-test.scp пустой скорее всего, написано же, что обработано 0
источник

II

Igor Ishin in Распознавание речи
источник

II

Igor Ishin in Распознавание речи
источник

II

Igor Ishin in Распознавание речи
все есть
источник

II

Igor Ishin in Распознавание речи
я ж говорю, полностью постарался сделать как у Вас, чтобы свести пространство для ошибки к минимуму
источник

NS

Nikolay Shmyrev in Распознавание речи
Запускается всё это дело как?
источник

II

Igor Ishin in Распознавание речи
через Ваш файл  decode.sh
источник