Телеграмм чат группы cmusphinx

@nshmyrev привет, а есть ли пример yaml файла (описывающего приатаченную модель) для kaldi-gstreamer-server?.. или в целом, этот вариант должен подойти - https://github.com/alumae/kaldi-gstreamer-server/blob/master/sample_english_nnet2.yaml?.. за исключением правки путей...

GitHub

alumae/kaldi-gstreamer-server

Real-time full-duplex speech recognition server, based on the Kaldi toolkit and the GStreamer framwork. - alumae/kaldi-gstreamer-server

источник

17:13пожаловаться #6

NS

Nikolay Shmyrev in Распознавание речи

Sergey Korol

@nshmyrev привет, а есть ли пример yaml файла (описывающего приатаченную модель) для kaldi-gstreamer-server?.. или в целом, этот вариант должен подойти - https://github.com/alumae/kaldi-gstreamer-server/blob/master/sample_english_nnet2.yaml?.. за исключением правки путей...

GitHub

alumae/kaldi-gstreamer-server

Real-time full-duplex speech recognition server, based on the Kaldi toolkit and the GStreamer framwork. - alumae/kaldi-gstreamer-server

https://github.com/alumae/kaldi-gstreamer-server/issues/88

GitHub

Decoding with nnet3 LSTM #88

Hi, I want to use nnet3 model instead of nnet2. So, How should I modify the configuration from "librispeech_english_nnet2.yaml" file? Could you provide simple settings? I will appreciate...

источник

18:52пожаловаться #7

SK

Sergey Korol in Распознавание речи

@nshmyrev т.е. для этой модели нужен nnet-mode: 3?

источник

19:06пожаловаться #8

SK

Sergey Korol in Распознавание речи

или имелся ввиду линк на librispeech конфиг?

источник

19:07пожаловаться #9

2018 June 03

SK

Sergey Korol in Распознавание речи

в общем, попробовал разные варианты... worker стартует, но завершает работу при первом же запросе, без каких-либо ошибок в логе... с дефолтной англ моделью нормально работает...
попробовал протестить модель на чистом kaldi в докере - нормально все завелось с кастомными wav... точность тоже весьма и весьма неплохая...
@nshmyrev подскажи, пожалуйста, для передачи аудио потока с микрофона на сервер под твою модель нужно использовать online-audio-server-decode-faster + любой поддерживаемый клиент, верно?..

источник

00:38пожаловаться #10

VG

Veniamin Gvozdikov in Распознавание речи

Sergey Korol

в общем, попробовал разные варианты... worker стартует, но завершает работу при первом же запросе, без каких-либо ошибок в логе... с дефолтной англ моделью нормально работает...
попробовал протестить модель на чистом kaldi в докере - нормально все завелось с кастомными wav... точность тоже весьма и весьма неплохая...
@nshmyrev подскажи, пожалуйста, для передачи аудио потока с микрофона на сервер под твою модель нужно использовать online-audio-server-decode-faster + любой поддерживаемый клиент, верно?..

Оно просто так не запуститься, там костылить надо. Если что пингани в понедельник, я гляну на работе как у меня собирается контейнер

источник

00:39пожаловаться #11

VG

Veniamin Gvozdikov in Распознавание речи

Но там проблемы другие, если долго сервис в ожидании, то потом не отвечает на запросы. В целом его по уму бы переписать нормально.

источник

00:40пожаловаться #12

SK

Sergey Korol in Распознавание речи

@zloidemon понял, спасибо, в Пн пингану... вообще, для своей задачи я уже написал рабочий вариант на java под cmusphinx4 с ограниченной моделью... но хотелось бы сравнить результаты с kaldi... все говорят, что kaldi намного точнее... потому решил потестить...

источник

00:45пожаловаться #13

2018 June 05

SK

Sergey Korol in Распознавание речи

с пропатченной версией сервера удалось завестись с последней моделью (0.6)... отдельное спасибо @zloidemon за Dockerfile

источник

22:27пожаловаться #14

2018 June 06

LV

Leo V in Распознавание речи

а запости плиз докер файл?

источник

21:22пожаловаться #15

LV

Leo V in Распознавание речи

я тоже хочу попробовать наконец калди и русскую модель

источник

21:22пожаловаться #16

SK

Sergey Korol in Распознавание речи

Если @zloidemon не против, могу залить на GitHub.

источник

21:24пожаловаться #17

SK

Sergey Korol in Распознавание речи

Он мейнтейнер скрипта.

источник

21:25пожаловаться #18

VG

Veniamin Gvozdikov in Распознавание речи

Sergey Korol

Если @zloidemon не против, могу залить на GitHub.

Я сам залью позже, там есть что доделать.

источник

21:31пожаловаться #19

2018 June 07

IZ

Igor Zudov in Распознавание речи

@nshmyrev , здравствуйте! Почувствовал острую необходимость в расширении Вашей модели, а именно включении географических названий, некоторой профессиональной терминологии. Хочу как-то внести вклад в модель. В каком виде я могу предоставить вам информацию, чтобы вы могли вкючить ее в следующий релиз?

источник

16:33пожаловаться #20