Size: a a a

Распознавание речи

2019 July 10

V

Vlad in Распознавание речи
Это очень хорошо, что вы об этом сказали) лучше знать и быть готовым, чем потом ловить пинки из-за ошибок
источник

V

Vlad in Распознавание речи
Ладно, спасибо всем за информацию, напишу как получится (если получится) обучить реализацию синтеза от админа, что в закрепе:)
источник

V

Vlad in Распознавание речи
Кстати, ещё вопрос чисто из интереса: kaldi лучше espnet по скорости и качеству распознавания? На имеющихся готовых моделях (kaldi из закрепа, espnet есть скрипты для обучения на данных voxforge, но я их не проверял), свои создавать конечно можно (на тех же данных voxforge, но вряд ли они лучше имеющихся получатся)
источник

D

Dmitry in Распознавание речи
Народ, плиз, подскажите, что почитать по строительству модели, определяющей наличие шума в записи голоса (шумом являются любые окружающие звуки - бытовые, от транспорта и т.п.) - лучше книгу (название/автор) , но за дельные статьи тоже спасибо!
источник

AZ

Al Zatv in Распознавание речи
1) делаешь vad и находишь им участки паузы. Отбираешь те,в которых уверен (в начале фразы)
2) измеряешь уровень звука на участках паузы. Если он есть -- шум есть.

Или ты ищешь именно акустические события -- разовые вскрики,всплески, битое стекло,стук каблуков?
источник

D

Dmitry in Распознавание речи
Уточняю задачу: есть сет, в котором надо определить наличие посторонних шумов (не голос), думаю, что далее шум придётся отсеивать.
источник

D

Dmitry in Распознавание речи
Al Zatv
1) делаешь vad и находишь им участки паузы. Отбираешь те,в которых уверен (в начале фразы)
2) измеряешь уровень звука на участках паузы. Если он есть -- шум есть.

Или ты ищешь именно акустические события -- разовые вскрики,всплески, битое стекло,стук каблуков?
А замер уровня звука - это обычно тупо берутся мин/мах уровни или отсечение используют.
источник

NS

Nikolay Shmyrev in Распознавание речи
В общем виде надо строить модель для разделения источников вроде https://arxiv.org/pdf/1803.08629.pdf
источник

NS

Nikolay Shmyrev in Распознавание речи
что-то вроде такого https://github.com/yongxuUSTC/sednn
источник

D

Dmitry in Распознавание речи
🤝 спасибо, сейчас буду смотреть
источник

T

Toronto in Распознавание речи
Всем привет. Запустил mini_librispesh без модификаций, получил следующую ошибку.
‘’’steps/nnet3/chain/get_egs.sh: File data/train_clean_5_sp_hires/utt2uniq exists, so ensuring the hold-out set includes all perturbed versions of the same source utterance.
steps/nnet3/chain/get_egs.sh: Number of utterances is very small. Please check your data.’’’
источник

NS

Nikolay Shmyrev in Распознавание речи
Toronto
Всем привет. Запустил mini_librispesh без модификаций, получил следующую ошибку.
‘’’steps/nnet3/chain/get_egs.sh: File data/train_clean_5_sp_hires/utt2uniq exists, so ensuring the hold-out set includes all perturbed versions of the same source utterance.
steps/nnet3/chain/get_egs.sh: Number of utterances is very small. Please check your data.’’’
были ранее ошибки
источник

T

Toronto in Распознавание речи
Nikolay Shmyrev
были ранее ошибки
local/chain/run_tdnn.sh --stage 0
local/nnet3/run_ivector_common.sh: preparing directory for low-resolution speed-perturbed data (for alignment)
utils/data/perturb_data_dir_speed_3way.sh: data/train_clean_5_sp/feats.scp already exists: refusing to run this (please delete data/train_clean_5_sp/feats.scp if you want this to run)
источник

T

Toronto in Распознавание речи
После перезапуска упало на этом этапе. Перезапустил, продолжил с этого шага. Жду дальше
источник

T

Toronto in Распознавание речи
И почему-то грузит весь CPU, GPU отдыхает
источник

NS

Nikolay Shmyrev in Распознавание речи
kaldi без куды собрано?
источник

T

Toronto in Распознавание речи
Nikolay Shmyrev
kaldi без куды собрано?
Да
источник

T

Toronto in Распознавание речи
Пересобрать ?
источник

NS

Nikolay Shmyrev in Распознавание речи
Да
источник

T

Toronto in Распознавание речи
Спасибо!
источник