Size: a a a

Распознавание речи

2018 January 26

NK

ID:383386042 in Распознавание речи
Почему Вы используете аналоговый микрофон? Пробовали ли Вы цифровой микрофон? Порог сигнала как определяется, по дБ? дБ может генерировать любой источник. Как можно физически это учесть?
источник

АЕ

Алексей Ефремов in Распознавание речи
Если вы прочитали мой первый пост, то видели что я использую словарь и грамматику - в этой статье все то же и описано. Но как активировать распознавание после произнесения кодовой фразы - Джарвис/Лиза и т.д. это для меня остаётся вопросом? Нашел туториал в Хакер, но поскольку Пайтон мне быстро не даётся, то не могу понять с чего начать.
источник

АЕ

Алексей Ефремов in Распознавание речи
ID:383386042
Почему Вы используете аналоговый микрофон? Пробовали ли Вы цифровой микрофон? Порог сигнала как определяется, по дБ? дБ может генерировать любой источник. Как можно физически это учесть?
Потому что мне дан только аналоговый вход. Но, как я сказал, это моя проблема. С другой железкой буду использовать массив микрофонов. Ну а вообще в аналоге тоже можно отделить полезный сигнал от окружающего шума. В идеале нужна ЦОС, но для этого нужны мощности.
источник

АЕ

Алексей Ефремов in Распознавание речи
Николай! Сейчас моя основная проблема, что сфинкс по моей грамматике интерпретирует фоновый шум в реальные команды. Поэтому хочу реализовать активацию распознавания команды по одной ключевой фразе, например, Лиза.
источник

АЕ

Алексей Ефремов in Распознавание речи
Вот то что сейчас у меня получается. Все хорошо, но когда открыто окно, например, этот шум интерпретируется в команды.
источник

NS

Nikolay Shmyrev in Распознавание речи
Алексей Ефремов
Николай! Сейчас моя основная проблема, что сфинкс по моей грамматике интерпретирует фоновый шум в реальные команды. Поэтому хочу реализовать активацию распознавания команды по одной ключевой фразе, например, Лиза.
источник

АЕ

Алексей Ефремов in Распознавание речи
Спасибо, принцип понятен. Правда я такой же "старый" человек, который знает Си, php и JS, но не Python...
источник

NS

Nikolay Shmyrev in Распознавание речи
Алексей Ефремов
Спасибо, принцип понятен. Правда я такой же "старый" человек, который знает Си, php и JS, но не Python...
Сочувствую
источник

АЕ

Алексей Ефремов in Распознавание речи
Nikolay Shmyrev
Сочувствую
Спасибо за сочувствие. Что за ключ -time yes?
источник

АЕ

Алексей Ефремов in Распознавание речи
Николай, подскажите что значит этот вывод - "Лиза 38.330 38.490 0.845253"
источник

NS

Nikolay Shmyrev in Распознавание речи
найдено слово лиза
источник

NS

Nikolay Shmyrev in Распознавание речи
старт 38.3 с
источник

NS

Nikolay Shmyrev in Распознавание речи
конец 38.49 с
источник

NS

Nikolay Shmyrev in Распознавание речи
мера уверенности в обнаружении 0.845253
источник

АЕ

Алексей Ефремов in Распознавание речи
С такими настройками pocketsphinx_continuous -infile test_record.wav -hmm /root/zero_ru_cont_8k_v3/zero_ru.cd_semi_4000/ -dict /root/rus_dict -keyphrase 'Лиза' -kws_threshold 1e-9 -time yes -logfn /dev/null
источник

АЕ

Алексей Ефремов in Распознавание речи
Выдает так: Лиза
Лиза 13.370 13.690 0.853920
Лиза
Лиза 27.090 27.260 0.847199
Лиза Лиза
Лиза 38.330 38.490 0.845253
Лиза 35.540 35.700 0.850085
источник

NS

Nikolay Shmyrev in Распознавание речи
cmusphinx-ru-5.2 лучше модель
источник

АЕ

Алексей Ефремов in Распознавание речи
Почему местами есть просто "Лиза", а местами "Лиза Лиза"?
источник

NS

Nikolay Shmyrev in Распознавание речи
два раза найдено лиза, поэтому два раза написано
источник

NS

Nikolay Shmyrev in Распознавание речи
первый раз в 35.7, второй в 38.4
источник