Size: a a a

Распознавание речи

2019 October 03

NS

Nikolay Shmyrev in Распознавание речи
Igor Ishin
@nshmyrev доброго дня!) я использовал вашу библиотеку kaldi-websocket-python, и прикрутил ее к java spring, в ходе работы из базы берутся аудио записи и транскрибируются, начинает поджираться память, подскажите это не может быть связано с библиотекой и мне надо с java разбираться?
С библиотекой это точно не связано, а утечки памяти можно через valgrind/massif отловить.
источник

II

Igor Ishin in Распознавание речи
Robert Arzin
Привет.
Хоть не ко мне вопрос и все же. Как ты понял, что идёт утечка памяти?
У меня транскрибируется база записей нонстопом, и на 400 записях у меня съело метров 300. Ну я не опытный, надо лучше разобраться в вопросе))
источник

II

Igor Ishin in Распознавание речи
Nikolay Shmyrev
С библиотекой это точно не связано, а утечки памяти можно через valgrind/massif отловить.
Благодарю! буду разбираться)
источник

NS

Nikolay Shmyrev in Распознавание речи
300 мб это в порядке вещей, где-то 500мб на поток нужно
источник

II

Igor Ishin in Распознавание речи
Nikolay Shmyrev
300 мб это в порядке вещей, где-то 500мб на поток нужно
Дальше больше, это я для примера сказал, просто это, так сказать, точные данные, которые я наблюдал, а так это непрерывное увеличение.
источник

II

Igor Ishin in Распознавание речи
Видимо как-то java не очень сборщик мусора отрабатывает, хотя я удалял объекты принудительно тоже, а эффект не сильно изменился
источник

NS

Nikolay Shmyrev in Распознавание речи
Ну да, короче, надо в valgrind смотреть
источник

NS

Nikolay Shmyrev in Распознавание речи
Ravid Levi
кто-то знает о настольном приложении пример Pocketspeech
ответил в @cmusphinx
источник

RA

Robert Arzin in Распознавание речи
Nikolay Shmyrev
300 мб это в порядке вещей, где-то 500мб на поток нужно
Ох Java такая java
источник

II

Igor Ishin in Распознавание речи
Robert Arzin
Ох Java такая java
Да тут скорее я такой я)))
источник

II

Igor Ishin in Распознавание речи
Ещё вопросик, в калди есть рецепт по определению языка lre, датасет там закрытый, а есть у кого-нибудь структура этого датасета? Пример небольшой, чтобы ориентироваться как-то, был бы признателен)
источник

NS

Nikolay Shmyrev in Распознавание речи
структура там такая же как везде: готовите utt2lang, wav.scp, segments, utt2spk и запускаете
источник

II

Igor Ishin in Распознавание речи
Я просто со своими руками mini_librispeech, в котором вообще ничего трогать не надо, еле запустил) хорошо буду пробовать, для этого же подойдут открытые какие-то датасеты, к примеру английский немецкий, чтобы попробовать, что из этого получится?
источник

NS

Nikolay Shmyrev in Распознавание речи
Любые данные на разных языках подойдут. Транскрипция не нужна, можно просто файлов накачать.
источник

NS

Nikolay Shmyrev in Распознавание речи
Можно с openslr разных языков надёргать
источник

II

Igor Ishin in Распознавание речи
Звучит так что это проще, чем распознавание речи, я правильно понимаю?
источник

II

Igor Ishin in Распознавание речи
В плане подготовки данных
источник

NS

Nikolay Shmyrev in Распознавание речи
да
источник
2019 October 04

RP

Roman Prilepskiy in Распознавание речи
Всем привет!
Подскажите пожалуйста, какие нужны требования по железу к серверу с Kaldi (CPU, GPU, RAM, хард)? Для обучения и для продакшена.
Кейс - на первых порах до 100 (в дальнейшем до 500) голосовых сообщений в день (небольшую часть нужно будет обрабатывать параллельно), длительность максимум минута, русский язык.
источник

NS

Nikolay Shmyrev in Распознавание речи
Ну как индус написал, примерно так и есть. 500 сообщений в день экономически не выгодно ничего тренировать.
источник