Size: a a a

Распознавание речи

2018 February 02

t2

tonko 22 in Распознавание речи
Декодер юниксовый ffmpeg
источник

t2

tonko 22 in Распознавание речи
Оболочки готовые видел, покоаырял парочку
источник

VG

Veniamin Gvozdikov in Распознавание речи
tonko 22
Для сервера пока что фласк
Да мне хотя бы просто модель сделать, а конвертацию уже потом можно пркрутить.
источник

VG

Veniamin Gvozdikov in Распознавание речи
Что бы из аудио файлов в текст конвертировало, а http уже проще всего накрутить
источник

t2

tonko 22 in Распознавание речи
Одну не смог поставить, которая понравилась
источник

t2

tonko 22 in Распознавание речи
Veniamin Gvozdikov
Да мне хотя бы просто модель сделать, а конвертацию уже потом можно пркрутить.
Ну я в скрипт декодера подставляю свои параметры и путь до .wav
источник

VG

Veniamin Gvozdikov in Распознавание речи
tonko 22
Ну я в скрипт декодера подставляю свои параметры и путь до .wav
У вас тоже там asr-server или самописный asr-server?
источник

t2

tonko 22 in Распознавание речи
Сервер на фласке с одним методом decode
источник

t2

tonko 22 in Распознавание речи
И простая оболочка с самописными интерфейсами к модели
источник

NS

Nikolay Shmyrev in Распознавание речи
Ну тут важно, что в конец нужно реализовать
источник

NS

Nikolay Shmyrev in Распознавание речи
Если короткие файлы декодировать -можно целиком через скрип
источник

NS

Nikolay Shmyrev in Распознавание речи
Но лучше в потоке по маленьким частям через сокет или вебсокет
источник

NS

Nikolay Shmyrev in Распознавание речи
Большие файлы лучше в виде долговременных задач передавать
источник

NS

Nikolay Shmyrev in Распознавание речи
Или опять же по маленьким частям
источник

VG

Veniamin Gvozdikov in Распознавание речи
Да мне надо бы интерфейс хоть какой-то, что бы вот ваш скрипт переделать в коде. И я могу просто модель загрузить и сервер работал. А как задачи в него файлы будут поставляться это уже второе дело. Может быть на самом деле 3 варианта декодирования из тех что мне необходимо будет:

1. Через очередь файлы отложенные не важен их размер
2. Короткие файлы, запрос ответ. Тут мне кажется правильно смотреть не размер файла, а длительность.
3. По частям онлайн файлы, большой в потоке, но сразу как в вебсокет писать например.
источник

AC

Artyom Chernetsov in Распознавание речи
а чем GStreamer так плох, что kaldi-gstreamer-server никто не юзает? Смотрю проект живет и обновляется
источник

VG

Veniamin Gvozdikov in Распознавание речи
Artyom Chernetsov
а чем GStreamer так плох, что kaldi-gstreamer-server никто не юзает? Смотрю проект живет и обновляется
Ой, мне очень далеко до этого. Разобраться хотя бы как модель использовать и что дописать надо. Запустил сборку pykaldi днем, дома уже, а там еще llvm собирается
источник

NS

Nikolay Shmyrev in Распознавание речи
gstreamer ерунда там куча всего ненужного
источник

NS

Nikolay Shmyrev in Распознавание речи
и нельзя модель между потоками разделять
источник
2018 February 07

VG

Veniamin Gvozdikov in Распознавание речи
Что-то у меня ни один из python драйверов так и не заработал. pykaldi не компилится, точней два дня сборки, там всякие llvm и тд и тп. А https://github.com/gooofy/py-kaldi-asr какое-то кривое, при запуске не находит символы библиотеках
источник