Size: a a a

Распознавание речи

2019 July 19

NS

Nikolay Shmyrev in Распознавание речи
Лучше espnet
источник

V

Vlad in Распознавание речи
А kaldi?
источник

NS

Nikolay Shmyrev in Распознавание речи
kaldi лучше всех
источник
2019 July 20

V

Vlad in Распознавание речи
Смотрю я тут про espnet и никто случайно не пробовал его в качестве синтезатора речи? Там есть такое
Как оно по качеству интересно, лучше ли будет tacotron2+waveglow или fastspeech какого
https://espnet.github.io/espnet/tutorial.html#demonstration-using-pretrained-models
источник

NS

Nikolay Shmyrev in Распознавание речи
Без разницы, алгоритм тот же. Но реализация может быть более правильная.
источник

V

Vlad in Распознавание речи
Понял, спасибо
источник
2019 July 21

NS

Nikolay Shmyrev in Распознавание речи
Воскресные новости. В 2016 году арт-группа из Екатеринбурга «Куда бегут собаки» создала распределённую псевдоголографическую речевую свинью.

https://thewallmagazine.ru/science-fest-2018/
источник
2019 July 22

a

agic in Распознавание речи
Nikolay Shmyrev
Лучше espnet
не зашел
источник

a

agic in Распознавание речи
kaldi вот неплох
источник

a

agic in Распознавание речи
ну обученный deepspeech показывает результаты лично у меня лучше
источник

a

agic in Распознавание речи
но этому виной могут быть лишь кривые руки ))
источник

AZ

Al Zatv in Распознавание речи
agic
ну обученный deepspeech показывает результаты лично у меня лучше
затрудняюсь поверить:)
источник

a

agic in Распознавание речи
Al Zatv
затрудняюсь поверить:)
комент выше )
источник

a

agic in Распознавание речи
сейчас соберу то что вы дали сверху в шапке
источник

AZ

Al Zatv in Распознавание речи
поторопился:)
На мой вкус,калди очень устарел по тому, как он смотрит на пользователя (ужасные замесы скриптов на баше,перле,питоне и авке; собственная нейросетевая библиотека аж в трех версиях). Но все более-менее неплохо настроено чтобы давать неплохой результат терпеливому пользователю. Думаю, еще годик-другой калди проскрипит,а потом уж "даст дорогу молодым".
источник

a

agic in Распознавание речи
мне важен еще один параметр весьма специфичен у меня не нужно распозновать много
источник

a

agic in Распознавание речи
мне важна именно скорость распознования
источник

a

agic in Распознавание речи
и калди почему то медленее deepspeech
источник

NS

Nikolay Shmyrev in Распознавание речи
Уметь настраивать надо. Kaldi на чистом gpu выдает 3000xRT, никакому дипспичу это не снилось.
источник

NS

Nikolay Shmyrev in Распознавание речи
Al Zatv
поторопился:)
На мой вкус,калди очень устарел по тому, как он смотрит на пользователя (ужасные замесы скриптов на баше,перле,питоне и авке; собственная нейросетевая библиотека аж в трех версиях). Но все более-менее неплохо настроено чтобы давать неплохой результат терпеливому пользователю. Думаю, еще годик-другой калди проскрипит,а потом уж "даст дорогу молодым".
рекламой задавят только если
источник