Size: a a a

Natural Language Processing

2020 January 12

NS

Nikolay Shmyrev in Natural Language Processing
deepspeech так себе в целом моделька, я про это уже писал. они её на librispeech перетренируют
источник

YB

Yuri Baburov in Natural Language Processing
Nikolay Shmyrev
deepspeech так себе в целом моделька, я про это уже писал. они её на librispeech перетренируют
это понятно, что у них моделька фиговая, у нас своя модель, конечно.
но когда я именно DS тренировал на большом корпусе, тогда тоже получалось неплохо, конечно.
источник

NS

Nikolay Shmyrev in Natural Language Processing
Ну в тексте новости про deepspeech 0.6 модель, какая есть.
источник

YB

Yuri Baburov in Natural Language Processing
расскажу что не так в прочтении новости:
"...поддерживающая русский язык"
"Языковая модель занимает всего 50Мб и работает точнее DeepSpeech"
вот все и подумали, что это про русский язык.
источник

NS

Nikolay Shmyrev in Natural Language Processing
Искусство заголовка 😉
источник

YB

Yuri Baburov in Natural Language Processing
а, понял, говоришь ещё и про реализацию DeepSpeech от Mozilla. есть ещё
https://github.com/SeanNaren/deepspeech.pytorch — другая реализация, со своими другими недостатками
источник

YB

Yuri Baburov in Natural Language Processing
Nikolay Shmyrev
Искусство заголовка 😉
не очень получилось, на мой взгляд.. IT специалисты не любят махинаций в заголовках. но ок, любое развитие — это уже хорошо. kaldi без враппера — это действительно жесть.
источник

YB

Yuri Baburov in Natural Language Processing
вот, Даниил дописал статью со сравнением точности на русском языке вашей открытой модели и облаков.
https://habr.com/ru/post/470696/
источник

NS

Nikolay Shmyrev in Natural Language Processing
супер, спасибо!
источник

YB

Yuri Baburov in Natural Language Processing
Yuri Baburov
вот, Даниил дописал статью со сравнением точности на русском языке вашей открытой модели и облаков.
https://habr.com/ru/post/470696/
а вот точность моделей типа улучшенных DeepSpeech на большом корпусе... как видишь, всё дело в размере корпуса, а модель сама по себе норм.
источник

NS

Nikolay Shmyrev in Natural Language Processing
Модель deepspeech не норм точно, этож сколько лет архитектуре. Понятно, что её можно дотянуть. Но лучше quarznet от нвидии взять или ещё какую посовременнее.
источник

NS

Nikolay Shmyrev in Natural Language Processing
rnnt в espnet сделали
источник

YB

Yuri Baburov in Natural Language Processing
непосредственно сам DS я бы на таком большом корпусе конечно побоялся тренировать, да :)
источник

NS

Nikolay Shmyrev in Natural Language Processing
Про то и речь 😉
источник

YB

Yuri Baburov in Natural Language Processing
Nikolay Shmyrev
rnnt в espnet сделали
эту можем в профильной группе обсудить, кстати.
источник

NS

Nikolay Shmyrev in Natural Language Processing
Yuri Baburov
эту можем в профильной группе обсудить, кстати.
С удовольствием! Я правда не пробую у меня столько видеокарт нет 😉
источник

ZZ

Zigfrid Zvezdin in Natural Language Processing
Кто-нибудь знает сайт типа https://english.edward.io/ , но чтобы рядом со словами указывались их характеристики типа времени, рода, числа и пр.?
источник

AS

Alex Surname in Natural Language Processing
может кто подсказать по процессу обучения self attention? везде только использование заданных весов, без их изменения
источник

m

mel kaye in Natural Language Processing
чем можно чанкинг русского текста сделать?
источник

М

Михаил in Natural Language Processing
@nshmyrev А TTS для android не планируется? Я знаю только один для Android: RHVoice, но ему есть куда расти... Для iPhone ни одного не встречал.
источник