Size: a a a

Распознавание речи

2019 July 08

NS

Nikolay Shmyrev in Распознавание речи
Файл примера и модель какая
источник

II

Igor Ishin in Распознавание речи
Модель и файл ваши
источник

NS

Nikolay Shmyrev in Распознавание речи
Хорошо
источник

II

Igor Ishin in Распознавание речи
Там явно видно на 2ом слове расхождения
источник

II

Igor Ishin in Распознавание речи
Длина, которая определяется, захватывает 2 слова
источник
2019 July 09

NS

Nikolay Shmyrev in Распознавание речи
Igor Ishin
Я только GetDiagnosticsAndPrintOutput изменил, заранее извините за увиденное)
@lissen2me посмотрел. WordAlignLattice надо делать перед CompactLatticeToWordAlignment. Без этого правильных времён не будет, так как выходные метки смещённые в графе. В pykaldi-asr WordAlignLatticeLexicon
источник

II

Igor Ishin in Распознавание речи
Nikolay Shmyrev
@lissen2me посмотрел. WordAlignLattice надо делать перед CompactLatticeToWordAlignment. Без этого правильных времён не будет, так как выходные метки смещённые в графе. В pykaldi-asr WordAlignLatticeLexicon
Благодарю за потраченное время,  не заметил.
источник

a

agic in Распознавание речи
кто то знает годные статьи по пресбифонии
источник

a

agic in Распознавание речи
по возрастным изменения голоса
источник
2019 July 10

II

Igor Ishin in Распознавание речи
Николай, в итоге всеравно я пришел к Вашему kaldi-websocket-python, он действительно simple👌 и действительно хорош))), еще вопрос один есть, я вот нашел на просторах github https://github.com/dmort27/epitran в качестве g2p, лучше, чем ничего, конечно, но походу не фонтан, есть что-то, к примеру, для украинского языка, или ручками писать фонемы?
источник

NS

Nikolay Shmyrev in Распознавание речи
Igor Ishin
Николай, в итоге всеравно я пришел к Вашему kaldi-websocket-python, он действительно simple👌 и действительно хорош))), еще вопрос один есть, я вот нашел на просторах github https://github.com/dmort27/epitran в качестве g2p, лучше, чем ничего, конечно, но походу не фонтан, есть что-то, к примеру, для украинского языка, или ручками писать фонемы?
Что угодно можно взять https://montreal-forced-aligner.readthedocs.io/en/latest/pretrained_models.html или espeak, можно и epitran
источник

II

Igor Ishin in Распознавание речи
а тот момент, что не совсем корректные фонемы будут, не слишком критично?
источник

NS

Nikolay Shmyrev in Распознавание речи
не критично
источник

II

Igor Ishin in Распознавание речи
я о том что Женя и жена epitran преобразовал как zena
источник

AZ

Al Zatv in Распознавание речи
koroleva voinov:)
источник

II

Igor Ishin in Распознавание речи
))
источник

II

Igor Ishin in Распознавание речи
чет в голос)
источник

NS

Nikolay Shmyrev in Распознавание речи
epitran так себе я думаю, не смотрел глубоко, но не впечатляет
источник

II

Igor Ishin in Распознавание речи
я посмотрю то, что Вы предложили, на крайняк запряжем спецов которые ручками будут строчить тексты)
источник

NS

Nikolay Shmyrev in Распознавание речи
shmyrev@gate:~/t/UA$ phonetisaurus-g2p --model=model.fst --input=жена
16.1531 zh e n a
shmyrev@gate:~/t/UA$ phonetisaurus-g2p --model=model.fst --input=женя
19.0668 zh e nj a
shmyrev@gate:~/t/UA$ phonetisaurus-g2p --model=model.fst --input=молоко
19.8325 m o l o k o
shmyrev@gate:~/t/UA$ phonetisaurus-g2p --model=model.fst --input=здоровеньки
29.9609 z d o r o w e nj k y
источник