Это какой-то промежуточный результат. Сам словарь наверное не представляет ценности. Ontolex/lexinfo - всего-лишь формат, а сами слова с разметкой - из opencorpora, она и так доступна.
кстати, есть ли g2p на нейронках для английского, но без сильного акцента? использовал эту либу https://github.com/Kyubyong/g2p но там очень заметный бритиш аксент
кстати, есть ли g2p на нейронках для английского, но без сильного акцента? использовал эту либу https://github.com/Kyubyong/g2p но там очень заметный бритиш аксент
Там нет акцента никакого, натренировано на cmudictе. Для британского есть словарь beep. Для американского есть pronlex, он поточнее, чем cmudict. Вот тут можно скачать http://hollingk.github.io/code/pronun_lab.tgz, но там слова давно не обновлялись.
Там нет акцента никакого, натренировано на cmudictе. Для британского есть словарь beep. Для американского есть pronlex, он поточнее, чем cmudict. Вот тут можно скачать http://hollingk.github.io/code/pronun_lab.tgz, но там слова давно не обновлялись.