Size: a a a

Распознавание речи

2019 May 10

NS

Nikolay Shmyrev in Распознавание речи
Ещё ЦРТ победило в voices 2019 вроде,  чем можно поздравить
источник

AZ

Al Zatv in Распознавание речи
Вот,например,первая попавшаяся фраза. Не жужжит:)
источник

AZ

Al Zatv in Распознавание речи
источник

AZ

Al Zatv in Распознавание речи
Хоть и есть помарки.
источник

RA

Robert Arzin in Распознавание речи
звучит очень круто
источник

NS

Nikolay Shmyrev in Распознавание речи
Ну вот где-то в конце в районе "задумались" в "за"
источник

AZ

Al Zatv in Распознавание речи
Да, voices затащили. И в speaker recognition, и,особенно, в ASR.
источник

NS

Nikolay Shmyrev in Распознавание речи
В начале в "своего" в "сво" тоже
источник

NS

Nikolay Shmyrev in Распознавание речи
Ну это может мне кажется
источник

NS

Nikolay Shmyrev in Распознавание речи
А и ещё есть http://mlschool.speechpro.ru, может кому интересно
источник

RA

Robert Arzin in Распознавание речи
выглядит довольно не плохо
крутая инициатива!
спасибо, что поделились! 😊
источник
2019 May 12

NS

Nikolay Shmyrev in Распознавание речи
Google Docs
Факторы, влияющие на использование голосовых ассистентов на российском рынке
Уважаемый респондент,

приглашаем Вас принять участие в исследовании об использовании голосовых ассистентов. Все ответы анонимны и будут использоваться только в совокупности с ответами других респондентов. Прохождение опроса займёт около 7 минут.

Голосовой ассистент (например Apple Siri, Amazon Alexa, Google Assistant, Microsoft Cortana, Яндекс Алиса) - сервис на основе искусственного интеллекта, распознающий человеческую речь и способный выполнить определенное действие в ответ на голосовую команду. Чаще всего голосовые помощники используются в смартфонах, умных колонках, веб-браузерах.

Исследование проводится в рамках написания магистерской диссертации. Ваш ответ важен для нас вне зависимости от того, пользовались Вы ранее голосовыми ассистентами или нет. Спасибо за Ваше  участие!
источник
2019 May 13

RA

Robert Arzin in Распознавание речи
@nshmyrev  Николай, а есть в открытом доступе исходники фронта?
источник

RA

Robert Arzin in Распознавание речи
Выложил http://alphacephei.com/kaldi/kaldi-ru-0.6.tar.gz, улучшена точность распознавания. Для работы требуется Kaldi 5.4. Демонстрация тут -> https://demo.alphacephei.com/ru/ (требуется Google Chrome).
источник

RA

Robert Arzin in Распознавание речи
Nikolay Shmyrev
Google Docs
Факторы, влияющие на использование голосовых ассистентов на российском рынке
Уважаемый респондент,

приглашаем Вас принять участие в исследовании об использовании голосовых ассистентов. Все ответы анонимны и будут использоваться только в совокупности с ответами других респондентов. Прохождение опроса займёт около 7 минут.

Голосовой ассистент (например Apple Siri, Amazon Alexa, Google Assistant, Microsoft Cortana, Яндекс Алиса) - сервис на основе искусственного интеллекта, распознающий человеческую речь и способный выполнить определенное действие в ответ на голосовую команду. Чаще всего голосовые помощники используются в смартфонах, умных колонках, веб-браузерах.

Исследование проводится в рамках написания магистерской диссертации. Ваш ответ важен для нас вне зависимости от того, пользовались Вы ранее голосовыми ассистентами или нет. Спасибо за Ваше  участие!
странный опрос. хоть я его и прошел, но я так и не понял зачем была сдела градация от 1 до 7
источник

AZ

Alexey Zholobov in Распознавание речи
А есть в калди какой-нибудь бенчмарк, чтобы прозрачно можно было сосчитать попугаев на разных сетапах?
источник

NS

Nikolay Shmyrev in Распознавание речи
Alexey Zholobov
А есть в калди какой-нибудь бенчмарк, чтобы прозрачно можно было сосчитать попугаев на разных сетапах?
Там одни сплошные бенчмарки
источник

AZ

Alexey Zholobov in Распознавание речи
То есть брать любу задачу потяжелее и замерять через time?
источник

RA

Robert Arzin in Распознавание речи
Alexey Zholobov
То есть брать любу задачу потяжелее и замерять через time?
Ну да
источник
2019 May 14

AO

Andrei Obyortyshev in Распознавание речи
Возникла пара вопросов про базовые вещи, хочу уточнить:
Закреплённая модель тренирована же на сэмплах 8/16 кгц? И, сответственно, 16кгцовые входные данные будут распознаваться лучше, чем какие нибудь 44100?
источник