Size: a a a

Распознавание речи

2018 March 02

vb

vad babushkin in Распознавание речи
За дни - имхо не разобраться. Но тут уж кто как.
источник

АЕ

Алексей Ефремов in Распознавание речи
vad babushkin
Терпение для этой задачи - наипервейшее дело :) Думаю совсем коробочного варианта не найти.  Чтобы купить коробочку, запустить программу, надиктовать и она сразу же заработала - пока не видел такого.  Nuance - главный патентодержатель этой сферы мог бы, выпустить, у них всё есть, но не шевелится, поэтому рынок просто профукает. Железные платы для распознавания на десятки слов продаются. Но везде придётся писать, компилировать, адаптировать.
Мне вообще как-то странно, что ещё никто не сделал установочный пакет, в котором через веб можно было бы сформировать свой словарь, грамматику, ключевые слова, выбрать акустическую модель, файл или real-time запись с нужного микрофона, написать фразы команд и ассигновать к ним соответствующие команды/скрипты, включить сервис и наслаждаться его работой!
источник

АЕ

Алексей Ефремов in Распознавание речи
Вот Николай в какой-то подобной же сфере работает. Ну неужели никто такой старт-ап не делал?
источник

АЗ

Александр Златокрылец in Распознавание речи
Не хватает кооперации
источник

vb

vad babushkin in Распознавание речи
на мой взгляд дело в патентах. Nuance монстр.
источник

vb

vad babushkin in Распознавание речи
а если выгода проблематично кроме как для юристов, то инвесторов нет
источник

АЕ

Алексей Ефремов in Распознавание речи
vad babushkin
на мой взгляд дело в патентах. Nuance монстр.
Мне кажется в sphinx для таких задач, которые я описал уже все есть. Только надо нормального программера, а не такого самоучку как я...и будет продукт - все в одном под raspbian/armbian/debian и т.д.
источник

vb

vad babushkin in Распознавание речи
лет 7 loquendo сделала чудный голос Ольга, и ASR у них был даже под Linux (таки дорогой). Пришёл Nuance, припугнул судами, потом съел. Ни Ольги ни Дмитрия ни ASR. Что то для телекома предлагают за конский ценник
источник

vb

vad babushkin in Распознавание речи
Да, Sphinx и особенно Kaldi это круто. И думается Николай примерно в таком стартапе сейчас и работает :) Пусть сделают, торопить не надо
источник

АЕ

Алексей Ефремов in Распознавание речи
vad babushkin
а если выгода проблематично кроме как для юристов, то инвесторов нет
Да тут и инвесторов не надо ведь sphinx - это gpl2? Просто время, знания в программировании на phyton/php/js/jquery и желание сделать удобный продукт хотя бы для себя. А там и свободный донат тебя найдёт:)
источник

АЗ

Александр Златокрылец in Распознавание речи
Вот интересный проект, помоему здесь не упоминался, Это не sphinx конечно, но всё же: @voicybot
источник

vb

vad babushkin in Распознавание речи
да, интересно. спасибо
источник

t2

tonko 22 in Распознавание речи
Александр Златокрылец
Вот интересный проект, помоему здесь не упоминался, Это не sphinx конечно, но всё же: @voicybot
Играл с ним, это клиент к яндекс ASR (который местами хуже, чем модель Kaldi 0.4 от Николая) и wit.ai который в целом получше, вроде это стартап майрософта
источник

t2

tonko 22 in Распознавание речи
Сейчас переписал клиент к яндексу, который на protobuf
источник

t2

tonko 22 in Распознавание речи
Пришлось исходники их клиента ковырять, какая-же в яндексе плохая поддержка третьего питона. Эх, легаси
источник

vb

vad babushkin in Распознавание речи
5 лет назад в ASR  с русским языком вообще пустошь была :) Так что прогресс даже со 2 Питоном это хорошо :)
источник

vb

vad babushkin in Распознавание речи
we have such demo too https://demo.alphacephei.com (use in chrome)
источник

vb

vad babushkin in Распознавание речи
Николай дал ссылку в основной ветке
источник

NS

Nikolay Shmyrev in Распознавание речи
Это для индийцев ссылка 😉
источник

vb

vad babushkin in Распознавание речи
Беда :) Но надежда есть
источник