Size: a a a

Распознавание речи

2019 February 14

NS

Nikolay Shmyrev in Распознавание речи
Записи ещё надо показать. Там эхо наверное сильное.
источник

ММ

Мария Мамонова in Распознавание речи
источник

ММ

Мария Мамонова in Распознавание речи
источник

ММ

Мария Мамонова in Распознавание речи
на второй- результата нет. на первой распознает "включить звук"
источник

NS

Nikolay Shmyrev in Распознавание речи
файлы должны быть 16khz
источник

NS

Nikolay Shmyrev in Распознавание речи
mono
источник

ММ

Мария Мамонова in Распознавание речи
Nikolay Shmyrev
модель cmusphinx-ru вместо zero
после этого появилась ошибка
ERROR: "dict.c", line 195: Line 1: Phone 'll' is mising in the acoustic model; word 'включить' ignored
и так для всех слов из словаря
источник

NS

Nikolay Shmyrev in Распознавание речи
словарь надо соответствующий
источник

ММ

Мария Мамонова in Распознавание речи
понятно
источник

ММ

Мария Мамонова in Распознавание речи
спасибо
источник

NS

Nikolay Shmyrev in Распознавание речи
sox 2.wav -r 16000 -c 1 22.wav
источник

NS

Nikolay Shmyrev in Распознавание речи
pocketsphinx_continuous -infile 22.wav -logfn /dev/null -jsgf test.jsgf -hmm cmusphinx-ru-5.2 -dict cmusphinx-ru-5.2/ru.dic
выключить звук
источник

NS

Nikolay Shmyrev in Распознавание речи
sox 1.wav -r 16000 -c 1 11.wav
источник

NS

Nikolay Shmyrev in Распознавание речи
pocketsphinx_continuous -infile 11.wav -logfn /dev/null -jsgf test.jsgf -hmm cmusphinx-ru-5.2 -dict cmusphinx-ru-5.2/ru.dic
включить звук
источник

ММ

Мария Мамонова in Распознавание речи
Nikolay Shmyrev
pocketsphinx_continuous -infile 22.wav -logfn /dev/null -jsgf test.jsgf -hmm cmusphinx-ru-5.2 -dict cmusphinx-ru-5.2/ru.dic
выключить звук
хм... это у меня вызывает ошибку
ERROR: "pocketsphinx.c", line 216: Failed to find mdef file inside the model folder specified with -hmm `cmusphinx-ru-5.2'
источник

ММ

Мария Мамонова in Распознавание речи
если же пишу через Python-скрипт

import os
from pocketsphinx import AudioFile, get_model_path, get_data_path

model_path = get_model_path()
data_path = get_data_path()

config = {
   'verbose': False,
   'audio_file': os.path.join(data_path, '/home/mmamonova/sphinx/audio/22.wav'),
   'buffer_size': 2048,
   'no_search': False,
   'full_utt': False,
   'hmm': os.path.join(model_path, 'cmusphinx-ru-5.2'),
   'lm': False,
   'jsgf': os.path.join(model_path, 'grammar.jsgf'),
   'dict': os.path.join(model_path, 'dictionary.dic')
}
audio = AudioFile(**config)
for phrase in audio:
    print(phrase)

то на выходе всё та же пустая строка
источник

NS

Nikolay Shmyrev in Распознавание речи
Мария Мамонова
если же пишу через Python-скрипт

import os
from pocketsphinx import AudioFile, get_model_path, get_data_path

model_path = get_model_path()
data_path = get_data_path()

config = {
   'verbose': False,
   'audio_file': os.path.join(data_path, '/home/mmamonova/sphinx/audio/22.wav'),
   'buffer_size': 2048,
   'no_search': False,
   'full_utt': False,
   'hmm': os.path.join(model_path, 'cmusphinx-ru-5.2'),
   'lm': False,
   'jsgf': os.path.join(model_path, 'grammar.jsgf'),
   'dict': os.path.join(model_path, 'dictionary.dic')
}
audio = AudioFile(**config)
for phrase in audio:
    print(phrase)

то на выходе всё та же пустая строка
Это ошибка в pocketsphinx-python, без тишины в конце он игнорирует результат https://stackoverflow.com/questions/53024632/pocketsphinx-python-does-not-return-last-utterance-while-iterating-over-audio
источник

NS

Nikolay Shmyrev in Распознавание речи
можно автора попинать, это не к нам
источник

NS

Nikolay Shmyrev in Распознавание речи
лучше использовать pocketsphinx напрямую без обёрток
источник
2019 February 15

ММ

Мария Мамонова in Распознавание речи
Понятно
источник