здравствуйте
есть распознавание аудиофайлов
import os
import sys
from pocketsphinx import AudioFile, get_model_path, get_data_path
model_path = get_model_path()
data_path = get_data_path()
config = {
'verbose': False,
'audio_file': os.path.join(data_path, "/home/mmamonova/speach2text-commands-sphinx/app/static/load_files/audio/"+ _file_name),
'buffer_size': 2048,
'no_search': False,
'full_utt': False,
'hmm': os.path.join(model_path, 'cmusphinx-ru-5.2'),
'lm': False,
'jsgf': os.path.join(model_path, 'grammar.jsgf'),
'dict': os.path.join(model_path, 'dictionary.dic'),
}
audio = AudioFile(**config)
for phrase in audio:
print (phrase)
но этот вариант получается очень зависим от шумов, да и распознает не идеально. подскажите, как можно сделать его менее зависимым от шумов, и, в целом, улучшить качество распознавания? можно ли как-то дообучить акустическую модель? (использую cmusphinx-ru-5.2)