На задаче телефонии не то что бы прям очень хорошо, но пользоваться можно
Новая русская модель для espnet на небольшом датасете с голосовыми запросами по поиску в базе данных с документами дала WER около 25-30%, это уже прям можно использовать в проде
На задаче телефонии не то что бы прям очень хорошо, но пользоваться можно
Новая русская модель для espnet на небольшом датасете с голосовыми запросами по поиску в базе данных с документами дала WER около 25-30%, это уже прям можно использовать в проде
А зачем в личку? Может кому то тоже почитать будет интересно. Все равно в этом чате не часто пишут.
Просто Влад рассказывает интересные вещи. Про kaldi и espnet. Я просто думал как нейронную сеть научить распознавать чеченскую речь. У нас в Грозном начали хайпить на сверточных сетях. Слышал, что сверточные сети устаревшая технология и сейчас рекуррентные сети с этим отлично справляются. Думал раньше, что на cmu sphinx лучше буду обучать. Тут мне рассказывают, что kaldi и espnet отлично работают в оффлайновом режиме
Я знаю инфу только по синтезу речи у него, и ещё говорят, что алгоритмы и гугла и Яндекса практически одинаковые, как и у kaldi/espnet, большое отличие только в том, что у гугла есть тонны данных для обучения