Телеграмм чат группы cmusphinx_ru страница 128

parrot.ru

Рейтинг популярных групп и каналов

В рейтинге участвует:

групп:

каналов:

Виртуальный сервер на SSD - недорого!

Аренда выделенных и виртуальных серверов (VDS/VPS), хостинг, аренда IP-адресов, администрирование, круглосуточная поддержка

qwarta.ru подробнее

Резервное копирование с проверкой на вирусы!!!

Удобный сервис создания резервных копий на любой сервер сети интернет. Отслеживайте изменения, проверяйте на вирусы. Надежно защитите свой бизнес!

go.backupland.com

Выбираете сервер? Любая конфигурация на заказ!

Аренда физических серверов любых конфигураций под любые запросы - 1С бухгалтерия, игровые сервера, нагруженные проекты, интернет-магазины!

qwarta.ru подробнее

Size: a a a

Распознавание речи

225 membersпожаловаться на группу

2019 July 10

V

Vlad in Распознавание речи

Это очень хорошо, что вы об этом сказали) лучше знать и быть готовым, чем потом ловить пинки из-за ошибок

источник

02:14пожаловаться #1

V

Vlad in Распознавание речи

Ладно, спасибо всем за информацию, напишу как получится (если получится) обучить реализацию синтеза от админа, что в закрепе:)

источник

02:16пожаловаться #2

V

Vlad in Распознавание речи

Кстати, ещё вопрос чисто из интереса: kaldi лучше espnet по скорости и качеству распознавания? На имеющихся готовых моделях (kaldi из закрепа, espnet есть скрипты для обучения на данных voxforge, но я их не проверял), свои создавать конечно можно (на тех же данных voxforge, но вряд ли они лучше имеющихся получатся)

источник

02:45пожаловаться #3

D

Dmitry in Распознавание речи

Народ, плиз, подскажите, что почитать по строительству модели, определяющей наличие шума в записи голоса (шумом являются любые окружающие звуки - бытовые, от транспорта и т.п.) - лучше книгу (название/автор) , но за дельные статьи тоже спасибо!

источник

09:15пожаловаться #4

AZ

Al Zatv in Распознавание речи

1) делаешь vad и находишь им участки паузы. Отбираешь те,в которых уверен (в начале фразы)
2) измеряешь уровень звука на участках паузы. Если он есть -- шум есть.

Или ты ищешь именно акустические события -- разовые вскрики,всплески, битое стекло,стук каблуков?

источник

09:19пожаловаться #5

D

Dmitry in Распознавание речи

Уточняю задачу: есть сет, в котором надо определить наличие посторонних шумов (не голос), думаю, что далее шум придётся отсеивать.

источник

09:23пожаловаться #6

D

Dmitry in Распознавание речи

1) делаешь vad и находишь им участки паузы. Отбираешь те,в которых уверен (в начале фразы)
2) измеряешь уровень звука на участках паузы. Если он есть -- шум есть.

Или ты ищешь именно акустические события -- разовые вскрики,всплески, битое стекло,стук каблуков?

А замер уровня звука - это обычно тупо берутся мин/мах уровни или отсечение используют.

источник

09:25пожаловаться #7

NS

Nikolay Shmyrev in Распознавание речи

В общем виде надо строить модель для разделения источников вроде https://arxiv.org/pdf/1803.08629.pdf

источник

09:29пожаловаться #8

NS

Nikolay Shmyrev in Распознавание речи

что-то вроде такого https://github.com/yongxuUSTC/sednn

yongxuUSTC/sednn

deep learning based speech enhancement using keras python, make it easy to use - yongxuUSTC/sednn

источник

09:30пожаловаться #9

D

Dmitry in Распознавание речи

🤝 спасибо, сейчас буду смотреть

источник

09:32пожаловаться #10

T

Toronto in Распознавание речи

Всем привет. Запустил mini_librispesh без модификаций, получил следующую ошибку.
‘’’steps/nnet3/chain/get_egs.sh: File data/train_clean_5_sp_hires/utt2uniq exists, so ensuring the hold-out set includes all perturbed versions of the same source utterance.
steps/nnet3/chain/get_egs.sh: Number of utterances is very small. Please check your data.’’’

источник

10:21пожаловаться #11

NS

Nikolay Shmyrev in Распознавание речи

Всем привет. Запустил mini_librispesh без модификаций, получил следующую ошибку.
‘’’steps/nnet3/chain/get_egs.sh: File data/train_clean_5_sp_hires/utt2uniq exists, so ensuring the hold-out set includes all perturbed versions of the same source utterance.
steps/nnet3/chain/get_egs.sh: Number of utterances is very small. Please check your data.’’’

были ранее ошибки

источник

10:36пожаловаться #12

T

Toronto in Распознавание речи

Nikolay Shmyrev

были ранее ошибки

local/chain/run_tdnn.sh --stage 0
local/nnet3/run_ivector_common.sh: preparing directory for low-resolution speed-perturbed data (for alignment)
utils/data/perturb_data_dir_speed_3way.sh: data/train_clean_5_sp/feats.scp already exists: refusing to run this (please delete data/train_clean_5_sp/feats.scp if you want this to run)

источник

21:23пожаловаться #13

T

Toronto in Распознавание речи

После перезапуска упало на этом этапе. Перезапустил, продолжил с этого шага. Жду дальше

источник

21:24пожаловаться #14

T

Toronto in Распознавание речи

И почему-то грузит весь CPU, GPU отдыхает

источник

21:41пожаловаться #15

NS

Nikolay Shmyrev in Распознавание речи

kaldi без куды собрано?

источник

21:42пожаловаться #16

T

Toronto in Распознавание речи

Nikolay Shmyrev

kaldi без куды собрано?

Да

источник

21:42пожаловаться #17

T

Toronto in Распознавание речи

Пересобрать ?

источник

21:42пожаловаться #18

NS

Nikolay Shmyrev in Распознавание речи

Да

источник

21:43пожаловаться #19

T

Toronto in Распознавание речи

Спасибо!

источник

21:43пожаловаться #20