Size: a a a

Распознавание речи

2019 January 31

RF

Richard Feynman in Распознавание речи
которую я докрутил с exe'шником скачанным с сайта
источник

RF

Richard Feynman in Распознавание речи
и затем где-то месяц я не мог додумать что надо еще установить словари
источник

RF

Richard Feynman in Распознавание речи
капец я начинающий программист
источник

RF

Richard Feynman in Распознавание речи
ну и в самом конце еще эта возня с перестановкой pythona из папки в папку
источник

RF

Richard Feynman in Распознавание речи
черт
источник

RF

Richard Feynman in Распознавание речи
ну надеюсь больше такого дерьма в моей жизни не будет
источник

NS

Nikolay Shmyrev in Распознавание речи
будет ещё
источник

RF

Richard Feynman in Распознавание речи
черт(
источник

RF

Richard Feynman in Распознавание речи
ну тогда бы программистом становился каждый дурак
источник

RF

Richard Feynman in Распознавание речи
это точно
источник
2019 February 04

RG

Ruslan Gaifullin in Распознавание речи
прив всем
источник
2019 February 06

RG

Ruslan Gaifullin in Распознавание речи
Nikolay Shmyrev
Выложил http://alphacephei.com/kaldi/kaldi-ru-0.6.tar.gz, улучшена точность распознавания.

Демонстрация тут -> https://alphacephei.com/ (требуется Google Chrome).

Для быстрой установки docker:

docker run -p 2700:2700 alphacep/kaldi-ru:latest

Выложил синтез речи https://github.com/alphacep/tn2-wg

Другие каналы https://t.me/cmusphinx (английский)

https://t.me/speech_recognition (новости о распознавании речи)
можно узнать, как тренировалось?
источник

RG

Ruslan Gaifullin in Распознавание речи
какой датасет, в первую очередь
источник
2019 February 08

NS

Nikolay Shmyrev in Распознавание речи
источник

NS

Nikolay Shmyrev in Распознавание речи
даже яблоко уже разпознаёт слова целиком, в яндексе всё ещё по звукам
источник
2019 February 14

ММ

Мария Мамонова in Распознавание речи
всем - здравствуйте
пишем демо-проект для распознавания команд из аудиофайлов. используется словарь и свой файл грамматики вместо языковой модели

Грамматика
#JSGF V1.0;
grammar commands;
<action> = (включить | выключить);
<device> = (проектор | звук | презентацию);
public <commands> = (<action> <device>);

словарь
включить v k ll uj ch i tt
выключить v y k ll uj ch ii tt
звук z v uu k
презентацию p rr i zz i n t aa c y uj
проектор p r ay i k t oo r

для проверки используются несколько аудио от разных людей (т.е., с разными голосами, громкостью, дикцией и т.д.) - всего 4 пока.
из этих 4 аудио результат выдается только на одном, остальные же результатом выдают пустую строку (т.е., как будто там никто ничего не говорил)

можете подсказать, как можно этот мент улучшить? чтобы распознавало больше входящих реплик?

в качестве акустической модели используется zero_ru.cd_cont_4000
источник

NS

Nikolay Shmyrev in Распознавание речи
Мария Мамонова
всем - здравствуйте
пишем демо-проект для распознавания команд из аудиофайлов. используется словарь и свой файл грамматики вместо языковой модели

Грамматика
#JSGF V1.0;
grammar commands;
<action> = (включить | выключить);
<device> = (проектор | звук | презентацию);
public <commands> = (<action> <device>);

словарь
включить v k ll uj ch i tt
выключить v y k ll uj ch ii tt
звук z v uu k
презентацию p rr i zz i n t aa c y uj
проектор p r ay i k t oo r

для проверки используются несколько аудио от разных людей (т.е., с разными голосами, громкостью, дикцией и т.д.) - всего 4 пока.
из этих 4 аудио результат выдается только на одном, остальные же результатом выдают пустую строку (т.е., как будто там никто ничего не говорил)

можете подсказать, как можно этот мент улучшить? чтобы распознавало больше входящих реплик?

в качестве акустической модели используется zero_ru.cd_cont_4000
использовать cmusphinx-ru
источник

ММ

Мария Мамонова in Распознавание речи
сейчас используется pocketsphinx - он, вроде, входит в cmusphinx?
источник

NS

Nikolay Shmyrev in Распознавание речи
модель cmusphinx-ru вместо zero
источник

ММ

Мария Мамонова in Распознавание речи
а, понято. спасибо, попробую
источник