Size: a a a

Natural Language Processing

2021 November 09

SM

Sergei Markoff in Natural Language Processing
источник

Eg

Elena gisly in Natural Language Processing
какие-то генераторы фейковых данных, типа https://mimesis.name ?


>>> g = mimesis.Business('ru')
>>> g.company()
'«Нефтегазиндустрия»'
>>> g.company()
'Агропромышленная группа «Продо»'
>>> g.company()
'Российский алюминий'
>>> g.company()
'Беталинк'
>>> g.company()
'Агрогруппа «Хорошее дело»'
источник

SS

Sergey Shulga in Natural Language Processing
Точно! Mimesis смотрел, использую для других данных,  неплохо, но нехватает ОПФ, хотя в принципе его можно через справочник рандомно дергать. И с кавычками надо разобраться
источник

AS

Alexander Sidorenko in Natural Language Processing
всем привет!
Кто-нибудь знает, какие предобученные модельки для русского можно использовать для задачи asymetric semantic search? Нужно по короткому вопросу искать релевантный большой блок текста. По аналогии с https://www.sbert.net/docs/pretrained-models/msmarco-v3.html
источник

SS

Sergey Shulga in Natural Language Processing
точнее ОПФ там есть, но только АО, ООО и ПАО.
источник

SS

Sergey Shulga in Natural Language Processing
источник

AB

Arcady Balandin in Natural Language Processing
Более лимение нормально
источник

DD

David Dale in Natural Language Processing
Я сейчас одну такую обучаю. Если есть желание, можем объединить усилия)
источник
2021 November 10

DD

David Dale in Natural Language Processing
Привет, коллеги! Кто-нибудь знает аналоги корпуса лингвистической приемлемости (CoLA) для русского языка?
Английский корпус CoLA содержит 10К предложений, помеченных как адекватные или неадекватные для английского языка (иными словами, грамматичные или неграмматичные). На нём круто обучать модели, которые бы оценивали адекватность текстов.
Такой корпус не очень просто собрать, т.к. оно должен покрывать большое количество разнообразных лингвистических явлений, определяющих приемлемость предложений.
Может быть, кто-то из вас натыкался на подобные исследования для русского языка?
источник

VG

Vadim Gudkov in Natural Language Processing
Ресерчил этот вопрос недавно. Вроде нет. Гуглил где-то пару часов
источник

IG

Ilya Gusev in Natural Language Processing
мне недавно говорили, что такой корпус скоро релизнут, но я не уверен, что могу об этом подробнее рассказывать  :)
источник

VG

Vadim Gudkov in Natural Language Processing
Вероятно, как часть RussianSuperGLUE. Я по крайней мере ожидал его там видеть
источник

DD

David Dale in Natural Language Processing
Я бы тоже ожидал, но увы 🤷‍♂️
источник

IG

Ilya Gusev in Natural Language Processing
Я написал человеку, который мне об этом говорил, может быть он сам что-то расскажет.
источник

DD

David Dale in Natural Language Processing
Спасибо большое!
источник

KA

Katya Artemova in Natural Language Processing
Все так:)
источник

VG

Vadim Gudkov in Natural Language Processing
Перевод + редактура или свой? Если не секрет
источник

KA

Katya Artemova in Natural Language Processing
Свой, переводить грамматические ошибки мы не стали )
источник

KA

Katya Artemova in Natural Language Processing
Где-то через пару месяцев опубликуем
источник

DD

David Dale in Natural Language Processing
🔥
источник