Size: a a a

Распознавание речи

2018 June 22

NS

Nikolay Shmyrev in Распознавание речи
Не видно тут что меняются пути до моделей
источник

NS

Nikolay Shmyrev in Распознавание речи
Видно что файлы переписываются причем часть остаётся старых. Так делать не надо.
источник

NS

Nikolay Shmyrev in Распознавание речи
Sphinx4 тоже использовать не надо лучше Калди ссылка в заголовке
источник
2018 June 25

NB

Natalya Bronina in Распознавание речи
источник

NB

Natalya Bronina in Распознавание речи
Николай, я пересобрала проект, но русская модель у меня все равно не работает. Я подключаю sphinx4-core-5prealpha-20160628.232526-10.jar и sphinx4-data-5prealpha-20160628.232535-10.jar
В результате распознавание английской речи работает, а при подключении русской модели (беру модель из cmusphinx-ru-5.2) получаю ошибку:
Exception in thread "main" java.lang.ArrayIndexOutOfBoundsException: 36
Код и результат во вложении. 
Подскажите, в чем может быть ошибка?
источник

NS

Nikolay Shmyrev in Распознавание речи
Файл feature transform из английской модели остался в русской
источник

NB

Natalya Bronina in Распознавание речи
Заработало! Спасибо!
источник
2018 June 27

NB

Natalya Bronina in Распознавание речи
Тестирую sphinx4 на java. Модель cmusphinx-ru-5.2. Почему то русские файлы-примеры с voxforge распознает нормально, а мои файлы - ужасно. Пытаюсь разобраться, почему так. У меня файл 8kHz-16bit. Моно. В коде прописываю configuration.setSampleRate(8000). Есть еще какие-то требования к формату файла, которые можно проверить?
источник

NB

Natalya Bronina in Распознавание речи
Есть какие-то встроенные способы (или сторонние открытые библиотеки), чтобы рассчитать оценку качества распознования?
источник

M

Mark I in Распознавание речи
Natalya Bronina
Тестирую sphinx4 на java. Модель cmusphinx-ru-5.2. Почему то русские файлы-примеры с voxforge распознает нормально, а мои файлы - ужасно. Пытаюсь разобраться, почему так. У меня файл 8kHz-16bit. Моно. В коде прописываю configuration.setSampleRate(8000). Есть еще какие-то требования к формату файла, которые можно проверить?
Переходить на калди
источник

M

Mark I in Распознавание речи
Ибо сфинкс уже устарел
источник

NB

Nikolay Begunov in Распознавание речи
Mark I
Ибо сфинкс уже устарел
Калди уступает в распознавании русского Яндекс API?
источник

M

Mark I in Распознавание речи
Nikolay Begunov
Калди уступает в распознавании русского Яндекс API?
Не сравнивал
источник

t2

tonko 22 in Распознавание речи
Nikolay Begunov
Калди уступает в распознавании русского Яндекс API?
не стоит сраванивать библиотеку с сервисом
источник

t2

tonko 22 in Распознавание речи
вообще вероятно что в яндексе Kaldi используют
источник

NB

Nikolay Begunov in Распознавание речи
Mark I
Не сравнивал
А какой процент распознавания можно ожидать?
источник

NB

Nikolay Begunov in Распознавание речи
От Kaldi
источник

EG

Eduard Golfeld in Распознавание речи
Вероятно, в вашем случае kaldi будет лучше, т.к. у яндекса огромный словарь, а у вас, вероятно, будет ограниченный
источник

EG

Eduard Golfeld in Распознавание речи
Кстати у яндекса есть коробочный вариант, его можно развернуть у себя и, вроде, там можно свои словари использовать
источник

NB

Nikolay Begunov in Распознавание речи
Eduard Golfeld
Вероятно, в вашем случае kaldi будет лучше, т.к. у яндекса огромный словарь, а у вас, вероятно, будет ограниченный
Он платный? Цель распознать разговоры с клиентами
источник