Size: a a a

Распознавание речи

2019 July 03

II

Igor Ishin in Распознавание речи
Искренне верю, просто у этих ребят есть немецкая и английская модели, они могут быть полезны. К слову сказать, а как нормальные люди определяют язык диктора? (к примеру есть 3 записи на 3х разных языках, как автоматизируется процесс выбора нужной языковой модели?)
источник

NS

Nikolay Shmyrev in Распознавание речи
Модели все заменяемые, можно их просто использовать
источник

NS

Nikolay Shmyrev in Распознавание речи
Определение языка в kaldi есть
источник

II

Igor Ishin in Распознавание речи
Nikolay Shmyrev
Определение языка в kaldi есть
Видимо до этого я ещё не добрался) а в моделях, я видимо что-то упускаю постоянно, буду дальше ковыряться, благодарю
источник
2019 July 04

NS

Nikolay Shmyrev in Распознавание речи
Натренировал тут модельку https://github.com/alphacep/tn2-wg
источник

NS

Nikolay Shmyrev in Распознавание речи
Над ударениями надо работать будет
источник

VK

Viacheslav Klimkov in Распознавание речи
а как с wavernn звучит?
источник

NS

Nikolay Shmyrev in Распознавание речи
rnn не наш метод
источник

VK

Viacheslav Klimkov in Распознавание речи
flow пока вроде еще не сильно надежно. узнать хоть что шумит
источник

NS

Nikolay Shmyrev in Распознавание речи
да недотренированная ещё поэтому шумит. И ещё 40 мел там всего 8 кгц для телефона.
источник

NS

Nikolay Shmyrev in Распознавание речи
Из серии - новые примненеия распознавания речи:

https://baaltii1.livejournal.com/200269.html

Моя гипотеза состоит в том, что в том потоке слов, который мы слышим по радио, есть регулярности по привязке определенных слов или слов из определенных ко-смысловых групп к моментам времени (с секундной точностью) не известные сознаниям тех, кто эти слова произносит. Дальше берется хорошее voice recognition software которое может генерить транскрипты  с time stamps на отдельные слова и составляется большой массив последовательностей моментов времени произнесения каждого из тех слов, с которыми у людей наиболее часто случаются синхронии. После этого в этих последовательностях нужно искать отклонения от случайности.
источник

AO

Andrei Obyortyshev in Распознавание речи
Что под kws на русском посоветуете использовать?
Калдиевский https://kaldi-asr.org/doc/kws.html или ещё что то?
источник

NS

Nikolay Shmyrev in Распознавание речи
Ну да
источник

AO

Andrei Obyortyshev in Распознавание речи
Ок, закопаюсь в него. Просто что-то WER под 40%, заявленный в доке https://pdfs.semanticscholar.org/3119/267d581fb65c3866ded0c194cfac76cc349a.pdf, не очень впечатляет :)

Насколько можно ожидать снижения на русском датасете при том, что они, как я понял, пример делали для языков с малым количеством данных?
источник

NS

Nikolay Shmyrev in Распознавание речи
На телефонных звонка WER 15-20% в хорошем качестве записи около 35% для плохого качества записи, лучше чем у гугла и яндекса. В статье базы для редких языков по 10 часов каждая, это совсем о другом.
источник

AO

Andrei Obyortyshev in Распознавание речи
Ок, пазл складывается. Спасибо :)
источник
2019 July 06

NS

Nikolay Shmyrev in Распознавание речи
Всем привет!
Нужен Python программист.
Требуется разработать систему автоответов на базе CMU Sphinx подключенной к SIP телефонии.  Опыт работы со сфинксом обязателен.
источник

RA

Robert Arzin in Распознавание речи
@nshmyrev Привет! Может стоит как-то систематизировать вакансии в чате, чтобы они всегда были в минутном доступе для всех желающих?
источник

NS

Nikolay Shmyrev in Распознавание речи
Можно, а какие предложения?
источник

RA

Robert Arzin in Распознавание речи
Nikolay Shmyrev
Можно, а какие предложения?
я думаю, лучше проставить хештег #работа или #вакансия.  Это уже будет достаточно и ничего не потерялось в потоке общения.
Остальные способы, по моему мнению, будут не эффективны для людей, которые ищут узкоспециализированных спецов.

к сожалению, ТГ не хватает общей "площади", где будут публиковаться в одном месте какая-то информация.
Надеюсь, Паша перехантил к себе людей из Янлекс.Дзен и они ведут над этим работу
источник