Size: a a a

Natural Language Processing

2020 March 12

MG

Michele Giardino in Natural Language Processing
Yuri Baburov
Kaldi-ru (там внутри есть), nsu ai / russian-g2p
nsu ai / russian-g2p — не нашёл у них датасета, только таблицу с правилами по конвертации
источник

YB

Yuri Baburov in Natural Language Processing
Michele Giardino
nsu ai / russian-g2p — не нашёл у них датасета, только таблицу с правилами по конвертации
источник

MG

Michele Giardino in Natural Language Processing
спасибо!
источник

ck

cnstntn kndrtv in Natural Language Processing
Какой у меня, оказывается, бардак на гитхабе... Прошу прощения за это.
Слова + транскрипция IPA есть тут
https://github.com/cnstntn-kndrtv/opencorpora2ontolex/tree/master/results
файлы result_*.json
источник

MG

Michele Giardino in Natural Language Processing
cnstntn kndrtv
Какой у меня, оказывается, бардак на гитхабе... Прошу прощения за это.
Слова + транскрипция IPA есть тут
https://github.com/cnstntn-kndrtv/opencorpora2ontolex/tree/master/results
файлы result_*.json
большое спасибо
источник

ck

cnstntn kndrtv in Natural Language Processing
Это какой-то промежуточный результат. Сам словарь наверное не представляет ценности. Ontolex/lexinfo - всего-лишь формат, а сами слова с разметкой - из opencorpora, она и так доступна.
источник

ck

cnstntn kndrtv in Natural Language Processing
источник

T

Teemoor in Natural Language Processing
кстати, есть ли g2p на нейронках для английского, но без сильного акцента? использовал эту либу https://github.com/Kyubyong/g2p но там очень заметный бритиш аксент
источник

NS

Nikolay Shmyrev in Natural Language Processing
Teemoor
кстати, есть ли g2p на нейронках для английского, но без сильного акцента? использовал эту либу https://github.com/Kyubyong/g2p но там очень заметный бритиш аксент
Там нет акцента никакого, натренировано на cmudictе. Для британского есть словарь beep. Для американского есть pronlex, он поточнее, чем cmudict. Вот тут можно скачать http://hollingk.github.io/code/pronun_lab.tgz, но там слова давно не обновлялись.
источник

T

Teemoor in Natural Language Processing
Nikolay Shmyrev
Там нет акцента никакого, натренировано на cmudictе. Для британского есть словарь beep. Для американского есть pronlex, он поточнее, чем cmudict. Вот тут можно скачать http://hollingk.github.io/code/pronun_lab.tgz, но там слова давно не обновлялись.
спасибо
источник

AB

Arcady Balandin in Natural Language Processing
А есть text to speech для любого языка, имея лишь МФА (IPA) фонетическое представление слов? Акцент не важен
источник

ES

Eugene Solomatin in Natural Language Processing
Коллеги добрый день.
А есть Speech to text приложения? Для русского. Как сервис или бесплатное.
Плиз подскажите..
источник

K

Kolya in Natural Language Processing
google/yandex speech to text как сервис
источник

D

Dmitry in Natural Language Processing
Eugene Solomatin
Коллеги добрый день.
А есть Speech to text приложения? Для русского. Как сервис или бесплатное.
Плиз подскажите..
Гугл, Яндекс
источник

DB

Dmitry Bohdanov in Natural Language Processing
Eugene Solomatin
Коллеги добрый день.
А есть Speech to text приложения? Для русского. Как сервис или бесплатное.
Плиз подскажите..
https://aws.amazon.com/ru/transcribe/ - этим пользуюсь. Работает с русским тоже
источник

D

Dmitry in Natural Language Processing
У обоих есть для этого библиотеки
источник

ES

Eugene Solomatin in Natural Language Processing
Dmitry
Гугл, Яндекс
А где там?
источник

K

Kolya in Natural Language Processing
ну напиши в поисковике, первые ссылки приведут)
источник

NS

Nikolay Shmyrev in Natural Language Processing
Arcady Balandin
А есть text to speech для любого языка, имея лишь МФА (IPA) фонетическое представление слов? Акцент не важен
https://itinerarium.github.io/phoneme-synthesis/   😉 не сказать что там качество хорошее. А так вполне себе 文字转语音
источник

AB

Arcady Balandin in Natural Language Processing
Это espeak, увы. Мне бы что нибудь современное, на нейронках
источник