Кстати, ещё вопрос чисто из интереса: kaldi лучше espnet по скорости и качеству распознавания? На имеющихся готовых моделях (kaldi из закрепа, espnet есть скрипты для обучения на данных voxforge, но я их не проверял), свои создавать конечно можно (на тех же данных voxforge, но вряд ли они лучше имеющихся получатся)
Народ, плиз, подскажите, что почитать по строительству модели, определяющей наличие шума в записи голоса (шумом являются любые окружающие звуки - бытовые, от транспорта и т.п.) - лучше книгу (название/автор) , но за дельные статьи тоже спасибо!
1) делаешь vad и находишь им участки паузы. Отбираешь те,в которых уверен (в начале фразы) 2) измеряешь уровень звука на участках паузы. Если он есть -- шум есть.
Или ты ищешь именно акустические события -- разовые вскрики,всплески, битое стекло,стук каблуков?
1) делаешь vad и находишь им участки паузы. Отбираешь те,в которых уверен (в начале фразы) 2) измеряешь уровень звука на участках паузы. Если он есть -- шум есть.
Или ты ищешь именно акустические события -- разовые вскрики,всплески, битое стекло,стук каблуков?
А замер уровня звука - это обычно тупо берутся мин/мах уровни или отсечение используют.
Всем привет. Запустил mini_librispesh без модификаций, получил следующую ошибку. ‘’’steps/nnet3/chain/get_egs.sh: File data/train_clean_5_sp_hires/utt2uniq exists, so ensuring the hold-out set includes all perturbed versions of the same source utterance. steps/nnet3/chain/get_egs.sh: Number of utterances is very small. Please check your data.’’’
Всем привет. Запустил mini_librispesh без модификаций, получил следующую ошибку. ‘’’steps/nnet3/chain/get_egs.sh: File data/train_clean_5_sp_hires/utt2uniq exists, so ensuring the hold-out set includes all perturbed versions of the same source utterance. steps/nnet3/chain/get_egs.sh: Number of utterances is very small. Please check your data.’’’
local/chain/run_tdnn.sh --stage 0 local/nnet3/run_ivector_common.sh: preparing directory for low-resolution speed-perturbed data (for alignment) utils/data/perturb_data_dir_speed_3way.sh: data/train_clean_5_sp/feats.scp already exists: refusing to run this (please delete data/train_clean_5_sp/feats.scp if you want this to run)