Size: a a a

Natural Language Processing

2021 March 16

AW

Alex Wortega in Natural Language Processing
Коллеги у кого то есть русскоязычные сеты по типу: картинка ; описание того что на картинке?
источник

НК

Николай Карпенко... in Natural Language Processing
David Dale
wordnet (http://wordnetweb.princeton.edu/perl/webwn) для английского, ruwordnet (https://www.ruwordnet.ru/ru) для русского
Руворд как-то можно скачать?
источник

DD

David Dale in Natural Language Processing
Николай Карпенко
Руворд как-то можно скачать?
Вообще скорее нет. Но мне некоторое время назад дали добро на распространение его прошлогодней версии: https://github.com/avidale/python-ruwordnet/
источник

SK

Sasha Korovii in Natural Language Processing
А есть opensource (self-hosted) решения, для того чтобы разметить свои данные для NER и классификации?
источник

MK

Max Kuznetsov in Natural Language Processing
Sasha Korovii
А есть opensource (self-hosted) решения, для того чтобы разметить свои данные для NER и классификации?
источник

DD

David Dale in Natural Language Processing
Sasha Korovii
А есть opensource (self-hosted) решения, для того чтобы разметить свои данные для NER и классификации?
labelstudio
источник

SK

Sasha Korovii in Natural Language Processing
Спасибо!!!
источник

Е

Егорка in Natural Language Processing
Sasha Korovii
А есть opensource (self-hosted) решения, для того чтобы разметить свои данные для NER и классификации?
источник

Eg

Elena gisly in Natural Language Processing
насчет русского wordnet: есть еще https://russianword.net/ в принципе...
источник

НК

Николай Карпенко... in Natural Language Processing
David Dale
Вообще скорее нет. Но мне некоторое время назад дали добро на распространение его прошлогодней версии: https://github.com/avidale/python-ruwordnet/
А сколько там записей?
источник

DD

David Dale in Natural Language Processing
Николай Карпенко
А сколько там записей?
около 50К синсетов, 130К вхождений слов/словосочетаний
источник

MT

Mikhail Tikhomirov in Natural Language Processing
версию 2.0 можно запросить для некоммерческого использования
источник

VB

Vladimir Borisov in Natural Language Processing
Привет! Пытаюсь запустить ноутбук для дистиляции newsrubert, там используется S3 для выкачки данных. Он требует креденшелы из файла slovnet.json. Где его можно найти?
источник
2021 March 17

BS

Bogdan Salyp in Natural Language Processing
David Dale
Есть mt5, в котором русский поддержан, работает нормально.
видимо не на задачах суммаризации, что-то не то получается при использовании даже large
источник

BS

Bogdan Salyp in Natural Language Processing
tonko 22
Пробовали крутить параметры при инференсе?
источник

BS

Bogdan Salyp in Natural Language Processing
Видимо имеет смысл обучать на русском t5/pegasus
источник

BS

Bogdan Salyp in Natural Language Processing
Но вообще очень странно, даже близко не нормальный результат выходит
Может у кого-нибудь получалось использовать t5 для суммаризации на русском? Или какую-либо альтернативу
источник

BS

Bogdan Salyp in Natural Language Processing
Тут кто-то в чате даже помню писал, что загнать в английский - использовать pegasus - перевести обратно в русский даёт пока что лучший результат (сообщения не нашел)
источник

BS

Bogdan Salyp in Natural Language Processing
источник

D

Dmitry in Natural Language Processing
Пробовали, результат такой себе если на этих предобученных моделях пробовать
источник