Телеграмм чат группы cmusphinx

10:53пожаловаться #4

NS

вроде того

Andrei Obyortyshev in Распознавание речи

11:00пожаловаться #5

AO

Ок, спасибо.

11:05пожаловаться #6

KY

Доброго времени суток всем. Вопрос о pocketsphinx в python. Собственно, pip install pocketsphinx и в бой. Посмотрел много ответов гугла на вопрос о keyphrase и везде написано, что при ключевой фразе, в данном случае активационной, нужно отключать *.lm. Задача сделать постоянное ожидание ключевой фразы, а после ее возникновения ожидать определенную команду с любым параметром (ограниченным словарем и процентом ошибки), то есть пример: "окей компьютер[фраза активации], найди[команда] значение слова[под-команда] рекогносцировка[произвольный параметр]", далее скрипт должен будет найти команду, ее подкоманду и параметр из полученной строчки. Соответственно для ключевого слова просто задается keyphrases.list, для команд создается словарик, а как потом получить произвольный параметр? Нельзя же динамически менять параметры pocketsphinx во время выполнения, чтобы подключить словарь и *.lm? Время инициализации стандартного словаря с фонетикой и *.lm без ключевой фразы примерно 25 сек, CPU отъедает примерно 20-40%. Вопрос как корректно сделать алгоритм под задачу?

21:44пожаловаться #7

NS

Подслова добавить в модель языка. Неизвестные слова тяжело распознавать.

21:47пожаловаться #8

KY

Nikolay Shmyrev

Подслова добавить в модель языка. Неизвестные слова тяжело распознавать.

Да даже если они есть в словаре(я там много слов не знаю, пока его читал 😃), вопрос именно о алгоритме. Как с ключевой фразой использовать стандартный словарь? То есть ожидать одну фразу "окей компьютер", после по упрощенному словарю с забитыми в него словами и JSGF определить команду и подкоманду, а далее включить всю мощь стандартной модели для определения произвольного параметра (но он будет ограничен размером словаря и точностью, но это не особо страшно)? (задача не совсем на поиграться, у сестры довольно плохое зрение, поэтому планировал в будущем прикручивать функционал по мере необходимости)

21:55пожаловаться #9

KY

Kim Young

Да даже если они есть в словаре(я там много слов не знаю, пока его читал 😃), вопрос именно о алгоритме. Как с ключевой фразой использовать стандартный словарь? То есть ожидать одну фразу "окей компьютер", после по упрощенному словарю с забитыми в него словами и JSGF определить команду и подкоманду, а далее включить всю мощь стандартной модели для определения произвольного параметра (но он будет ограничен размером словаря и точностью, но это не особо страшно)? (задача не совсем на поиграться, у сестры довольно плохое зрение, поэтому планировал в будущем прикручивать функционал по мере необходимости)

Просто может быть я что-то упускаю, на всякий случай еще раз прочту официальный тутор

Al Zatv in Распознавание речи

22:20пожаловаться #10

AZ

а произвольный параметр действительно произвольный? Просто если это число какое-то,то можно задать грамматику. Не знаю покетсфинкса, в других тулкитах это выглядело бы как создание грамматики,которая способна принимать именно твою фразу со всеми вариациями, компиляция этой грамматики,и распознавание. Компиляция грамматик может быть сделана очень шустрой, движок црт и нюанса компилят грамматику из десятков тысяч слов за доли секунды.

Al Zatv in Распознавание речи

22:25пожаловаться #11

AZ

а,прочел внимательнее, это ж запрос к словарю. да, если нет заготовленного заранее списка слов, то это прям ресерч, с подсловами и всем таким.

22:28пожаловаться #12

NS

Kim Young

Да даже если они есть в словаре(я там много слов не знаю, пока его читал 😃), вопрос именно о алгоритме. Как с ключевой фразой использовать стандартный словарь? То есть ожидать одну фразу "окей компьютер", после по упрощенному словарю с забитыми в него словами и JSGF определить команду и подкоманду, а далее включить всю мощь стандартной модели для определения произвольного параметра (но он будет ограничен размером словаря и точностью, но это не особо страшно)? (задача не совсем на поиграться, у сестры довольно плохое зрение, поэтому планировал в будущем прикручивать функционал по мере необходимости)

отдельно определять ключевую фразу, звук сохранять. Потом этот звук гнать на распознавалку с большим словарём.

22:29пожаловаться #13

2019 July 25

KY

Nikolay Shmyrev

отдельно определять ключевую фразу, звук сохранять. Потом этот звук гнать на распознавалку с большим словарём.

А разве есть возможность распознавать аудио файл динамично? Документация подробная вроде, но вот примеры нормальные отсутствуют, как и особенности методов. Все туторы предлагают для распознавания файлов запускать сфинкс как новый процесс, что быстро работать будет только с правилом грамматики и маленьким словарем, а не с 1+ млн вариантов и 500000 слов

Vlad in Распознавание речи

08:08пожаловаться #14

V

Kim Young

А разве есть возможность распознавать аудио файл динамично? Документация подробная вроде, но вот примеры нормальные отсутствуют, как и особенности методов. Все туторы предлагают для распознавания файлов запускать сфинкс как новый процесс, что быстро работать будет только с правилом грамматики и маленьким словарем, а не с 1+ млн вариантов и 500000 слов

Есть, просто делаете класс, где в конструкторе загружаете все данные, а потом в отдельном методе присылаете аудио для распознавания

Пример есть в моём чат боте с диплома: https://github.com/Desklop/Voice_ChatBot/blob/master/speech_to_text.py

GitHub

Desklop/Voice_ChatBot

Chatbot in russian with speech recognition using PocketSphinx and speech synthesis using RHVoice. The AttentionSeq2Seq model is used. Imlemented using Python3+TensorFlow+Keras. - Desklop/Voice_ChatBot

Vlad in Распознавание речи

11:37пожаловаться #15

V

Там используется обёртка для работы с pocketsphinx из python

11:38пожаловаться #16

KY

Chatbot in russian with speech recognition using PocketSphinx and speech synthesis using RHVoice. The AttentionSeq2Seq model is used. Imlemented using Python3+TensorFlow+Keras. - Desklop/Voice_ChatBot

Vlad

Есть, просто делаете класс, где в конструкторе загружаете все данные, а потом в отдельном методе присылаете аудио для распознавания

Пример есть в моём чат боте с диплома: https://github.com/Desklop/Voice_ChatBot/blob/master/speech_to_text.py

GitHub

Desklop/Voice_ChatBot

Ага, спасибо, посмотрю содержание позже

13:35пожаловаться #17

NS

МТС на проводе "мы ищем человека, который-бы развивал направление синтеза речи", пишите, кому интересно.