Size: a a a

Распознавание речи

2018 January 31

NS

Nikolay Shmyrev in Распознавание речи
Ладно, завтра разберёмся
источник

VG

Veniamin Gvozdikov in Распознавание речи
Nikolay Shmyrev
Ладно, завтра разберёмся
Ага, было бы не плохо. Я пробовал ещё в строке где 16/8 заменить просто на 1. Хотя не знаю что ещё может быть не так.
источник

VG

Veniamin Gvozdikov in Распознавание речи
@nshmyrev если найдется время, может посоветуете что сделат, я сегодня еще пробовал, но что-то даже с старой моделью 0.2 версии не вышло получать текстовые данные.
источник
2018 February 02

NS

Nikolay Shmyrev in Распознавание речи
Короче этот dialogflow бяка
источник

NS

Nikolay Shmyrev in Распознавание речи
Ну её
источник

VG

Veniamin Gvozdikov in Распознавание речи
Nikolay Shmyrev
Короче этот dialogflow бяка
Надо взять что-то другое?
источник

NS

Nikolay Shmyrev in Распознавание речи
Проще самому написать
источник

VG

Veniamin Gvozdikov in Распознавание речи
https://github.com/gooofy/py-kaldi-asr это завтра попробую
источник

VG

Veniamin Gvozdikov in Распознавание речи
@ache85 а у вас таких проблем не было http://dpaste.com/0W92V59 ? У меня что с вашей версией asr-server что с оригинально такое стало возникать на старте, и самое странное что я ничего не менял.
источник

AC

Artyom Chernetsov in Распознавание речи
Veniamin Gvozdikov
@ache85 а у вас таких проблем не было http://dpaste.com/0W92V59 ? У меня что с вашей версией asr-server что с оригинально такое стало возникать на старте, и самое странное что я ничего не менял.
нет, не было такой проблемы. Я последний раз с asr ковырялся на kaldi-ru-0.2, когда в модели еще не было ivector
источник

VG

Veniamin Gvozdikov in Распознавание речи
Artyom Chernetsov
нет, не было такой проблемы. Я последний раз с asr ковырялся на kaldi-ru-0.2, когда в модели еще не было ivector
Да это и без ivectore с моделью 0.2
источник

AC

Artyom Chernetsov in Распознавание речи
надо вспоминать. Я вроде подкрутил api ai чтобы английская 16k модель заработала, она заработала. А русскую я не прикручивал, там надо было морду модифицировать, чтобы она 8k отправляла  звук
источник

VG

Veniamin Gvozdikov in Распознавание речи
Artyom Chernetsov
надо вспоминать. Я вроде подкрутил api ai чтобы английская 16k модель заработала, она заработала. А русскую я не прикручивал, там надо было морду модифицировать, чтобы она 8k отправляла  звук
Английская у меня работал, я ещё полгода назад делал. Мне именно русская нужна
источник

VG

Veniamin Gvozdikov in Распознавание речи
Хотя бы что бы в http api писать, и получать результат, больше ничего не нужно. Как-то скриптами обвещивать это и вызывать в fork() не очень хочется
источник

AC

Artyom Chernetsov in Распознавание речи
у меня нет планов api ai допиливать. Помню что закончил именно на том, что надо в веб-морде перенастроить чтобы в backend отправлялся 8k звук, там захардкожено 16к
источник

VG

Veniamin Gvozdikov in Распознавание речи
Artyom Chernetsov
у меня нет планов api ai допиливать. Помню что закончил именно на том, что надо в веб-морде перенастроить чтобы в backend отправлялся 8k звук, там захардкожено 16к
Да не, просто спрашиваю. Сейчас я с питон библиотекой разбираюсь, может получится через нее сделать что-то, а то и fcgi это напоминает мне средневековье какое-то сейчас.
источник

t2

tonko 22 in Распознавание речи
Я сейчас свой сервер и оболочку под kaldi 0.4 пишу на питоне. Декодер в 8k уже имплементнул.
источник

VG

Veniamin Gvozdikov in Распознавание речи
tonko 22
Я сейчас свой сервер и оболочку под kaldi 0.4 пишу на питоне. Декодер в 8k уже имплементнул.
А какую библиотеку взял?
источник

VG

Veniamin Gvozdikov in Распознавание речи
https://github.com/pykaldi/pykaldi на это натолкнулся, у них там больше реалзиция чем то что выше скидывал.
источник

t2

tonko 22 in Распознавание речи
Veniamin Gvozdikov
А какую библиотеку взял?
Для сервера пока что фласк
источник