Телеграмм чат группы cmusphinx_ru страница 154

parrot.ru

Рейтинг популярных групп и каналов

В рейтинге участвует:

групп:

каналов:

Виртуальный сервер на SSD - недорого!

Аренда выделенных и виртуальных серверов (VDS/VPS), хостинг, аренда IP-адресов, администрирование, круглосуточная поддержка

qwarta.ru подробнее

Резервное копирование с проверкой на вирусы!!!

Удобный сервис создания резервных копий на любой сервер сети интернет. Отслеживайте изменения, проверяйте на вирусы. Надежно защитите свой бизнес!

go.backupland.com

Выбираете сервер? Любая конфигурация на заказ!

Аренда физических серверов любых конфигураций под любые запросы - 1С бухгалтерия, игровые сервера, нагруженные проекты, интернет-магазины!

qwarta.ru подробнее

Size: a a a

Распознавание речи

225 membersпожаловаться на группу

2019 October 03

NS

Nikolay Shmyrev in Распознавание речи

@nshmyrev доброго дня!) я использовал вашу библиотеку kaldi-websocket-python, и прикрутил ее к java spring, в ходе работы из базы берутся аудио записи и транскрибируются, начинает поджираться память, подскажите это не может быть связано с библиотекой и мне надо с java разбираться?

С библиотекой это точно не связано, а утечки памяти можно через valgrind/massif отловить.

источник

21:10пожаловаться #1

II

Igor Ishin in Распознавание речи

Привет.
Хоть не ко мне вопрос и все же. Как ты понял, что идёт утечка памяти?

У меня транскрибируется база записей нонстопом, и на 400 записях у меня съело метров 300. Ну я не опытный, надо лучше разобраться в вопросе))

источник

21:34пожаловаться #2

II

Igor Ishin in Распознавание речи

Nikolay Shmyrev

С библиотекой это точно не связано, а утечки памяти можно через valgrind/massif отловить.

Благодарю! буду разбираться)

источник

21:34пожаловаться #3

NS

Nikolay Shmyrev in Распознавание речи

300 мб это в порядке вещей, где-то 500мб на поток нужно

источник

21:35пожаловаться #4

II

Igor Ishin in Распознавание речи

Nikolay Shmyrev

300 мб это в порядке вещей, где-то 500мб на поток нужно

Дальше больше, это я для примера сказал, просто это, так сказать, точные данные, которые я наблюдал, а так это непрерывное увеличение.

источник

21:36пожаловаться #5

II

Igor Ishin in Распознавание речи

Видимо как-то java не очень сборщик мусора отрабатывает, хотя я удалял объекты принудительно тоже, а эффект не сильно изменился

источник

21:38пожаловаться #6

NS

Nikolay Shmyrev in Распознавание речи

Ну да, короче, надо в valgrind смотреть

источник

22:07пожаловаться #7

NS

Nikolay Shmyrev in Распознавание речи

кто-то знает о настольном приложении пример Pocketspeech

ответил в @cmusphinx

источник

22:11пожаловаться #8

RA

Robert Arzin in Распознавание речи

Nikolay Shmyrev

300 мб это в порядке вещей, где-то 500мб на поток нужно

Ох Java такая java

источник

22:18пожаловаться #9

II

Igor Ishin in Распознавание речи

Ох Java такая java

Да тут скорее я такой я)))

источник

22:18пожаловаться #10

II

Igor Ishin in Распознавание речи

Ещё вопросик, в калди есть рецепт по определению языка lre, датасет там закрытый, а есть у кого-нибудь структура этого датасета? Пример небольшой, чтобы ориентироваться как-то, был бы признателен)

источник

22:19пожаловаться #11

NS

Nikolay Shmyrev in Распознавание речи

структура там такая же как везде: готовите utt2lang, wav.scp, segments, utt2spk и запускаете

источник

22:20пожаловаться #12

II

Igor Ishin in Распознавание речи

Я просто со своими руками mini_librispeech, в котором вообще ничего трогать не надо, еле запустил) хорошо буду пробовать, для этого же подойдут открытые какие-то датасеты, к примеру английский немецкий, чтобы попробовать, что из этого получится?

источник

22:23пожаловаться #13

NS

Nikolay Shmyrev in Распознавание речи

Любые данные на разных языках подойдут. Транскрипция не нужна, можно просто файлов накачать.

источник

22:26пожаловаться #14

NS

Nikolay Shmyrev in Распознавание речи

Можно с openslr разных языков надёргать

источник

22:27пожаловаться #15

II

Igor Ishin in Распознавание речи

Звучит так что это проще, чем распознавание речи, я правильно понимаю?

источник

22:28пожаловаться #16

II

Igor Ishin in Распознавание речи

В плане подготовки данных

источник

22:28пожаловаться #17

NS

Nikolay Shmyrev in Распознавание речи

да

источник

22:28пожаловаться #18

2019 October 04

RP

Roman Prilepskiy in Распознавание речи

Всем привет!
Подскажите пожалуйста, какие нужны требования по железу к серверу с Kaldi (CPU, GPU, RAM, хард)? Для обучения и для продакшена.
Кейс - на первых порах до 100 (в дальнейшем до 500) голосовых сообщений в день (небольшую часть нужно будет обрабатывать параллельно), длительность максимум минута, русский язык.

источник

10:17пожаловаться #19

NS

Nikolay Shmyrev in Распознавание речи

Ну как индус написал, примерно так и есть. 500 сообщений в день экономически не выгодно ничего тренировать.

источник

11:35пожаловаться #20