Size: a a a

Распознавание речи

2018 February 27

АЕ

Алексей Ефремов in Распознавание речи
Nikolay Shmyrev
Дочитать только за деньги её можно. По содержанию такие статьи более-менее одинаковые.
источник

АЕ

Алексей Ефремов in Распознавание речи
Nikolay Shmyrev
Это хорошая идея. Ещё бы научиться время правильно совмещать между разными микрофонами, можно было бы направление определять.
Это идея для распределенной по помещениям системы. С какого виртуального микрофона уровень выше порогового с того и распознаем.
источник

NS

Nikolay Shmyrev in Распознавание речи
Алексей Ефремов
Это идея для распределенной по помещениям системы. С какого виртуального микрофона уровень выше порогового с того и распознаем.
Вот только не пойму в чём радость везде микрофоны пихать в собственном доме 😉 Нормальные люди даже камеры на ноутбуках заклеивают.
источник

АЕ

Алексей Ефремов in Распознавание речи
Прелесть в том, что у этих железок не будет выхода в www
источник
2018 February 28

LV

Leo V in Распознавание речи
я бы тоже кстати пихал микрофоны везде в доме
источник

LV

Leo V in Распознавание речи
научиться ставить свою прошивку на роутер и отрезать одну сеть от другой
источник

VA

Viacheslav A in Распознавание речи
источник

VA

Viacheslav A in Распознавание речи
свою прошивку
источник

VA

Viacheslav A in Распознавание речи
источник
2018 March 01

NS

Nikolay Shmyrev in Распознавание речи
Выложил http://alphacephei.com/kaldi/kaldi-ru-0.5.tar.gz, улучшена точность распознавания. Для работы требуется Kaldi 5.4. Демонстрация тут -> https://demo.alphacephei.com/ru/ (требуется Google Chrome).
источник
2018 March 02

АЕ

Алексей Ефремов in Распознавание речи
Николай. Ну а вообще есть ли готовое решение ("из коробки") для распознавания голоса или хотя бы речи на однопалатниках? Сейчас это тренд ведь!
источник

vb

vad babushkin in Распознавание речи
имхо вопрос малость некорректный. порядка 10 фраз решений много. Произвольное распознавание на одноплатниках - только как прокси на большую машину
источник

NS

Nikolay Shmyrev in Распознавание речи
источник

АЕ

Алексей Ефремов in Распознавание речи
vad babushkin
имхо вопрос малость некорректный. порядка 10 фраз решений много. Произвольное распознавание на одноплатниках - только как прокси на большую машину
Ок, уточню - офф-лайн, русский язык, только речь, 20-30 слов (включая предлоги), распознавание команды только после распознавания активационной фразы.
источник

vb

vad babushkin in Распознавание речи
источник

vb

vad babushkin in Распознавание речи
имеет смысл добавить ещё уточние: микроконтроллер или одноплатник под linux. Если первое - то если грубо здесь нет никакого анализа кроме Фурье :)
Если второе, то здесь уже можно Sphinx заюзать, с кастомной моделью, ключевыми фразами и прочими удобствами.
Следует отметить, для новичка это может являться шоком :) Порог вхождения - высок.
тем не менее например форум на исходниках даёт кучу примеров, где людям удавалось решить задачу. некоторые варианты оформлены пакетом скриптов, которые можно просто заточить под свою задачу
источник

АЕ

Алексей Ефремов in Распознавание речи
vad babushkin
имеет смысл добавить ещё уточние: микроконтроллер или одноплатник под linux. Если первое - то если грубо здесь нет никакого анализа кроме Фурье :)
Если второе, то здесь уже можно Sphinx заюзать, с кастомной моделью, ключевыми фразами и прочими удобствами.
Следует отметить, для новичка это может являться шоком :) Порог вхождения - высок.
тем не менее например форум на исходниках даёт кучу примеров, где людям удавалось решить задачу. некоторые варианты оформлены пакетом скриптов, которые можно просто заточить под свою задачу
Само собой unix! Я не совсем новичок, но мне не хватило терпения освоить phyton чтобы нормально работать со sphinx - https://www.ab-log.ru/forum/viewtopic.php?f=1&t=1172#p31007
Поэтому и интересуюсь коробочными вариантами.
источник

vb

vad babushkin in Распознавание речи
Терпение для этой задачи - наипервейшее дело :) Думаю совсем коробочного варианта не найти.  Чтобы купить коробочку, запустить программу, надиктовать и она сразу же заработала - пока не видел такого.  Nuance - главный патентодержатель этой сферы мог бы, выпустить, у них всё есть, но не шевелится, поэтому рынок просто профукает. Железные платы для распознавания на десятки слов продаются. Но везде придётся писать, компилировать, адаптировать.
источник

АЕ

Алексей Ефремов in Распознавание речи
Терпение мне надо поскольку делаю всё в то время когда должен спать, ибо другого времени нет. Но вот за три бессонных ночи победить не смог, точнее сделать то что мне требуется (см.выше).
источник

vb

vad babushkin in Распознавание речи
Вангую что всё улучшится в ближайшее время. Алеха всех победит, если ей конкуренцию не составлять. Не все готовы домашние переговоры через сервера прогонять, поэтому офлайн решения должны появится, даже если они платные. Ну а из бесплатных - KALDI весьма крута. Ставим домашний сервер, транслируем на него запросы, хоть с утюга. Профит
источник