Size: a a a

Natural Language Processing

2021 September 28

N

Nadia in Natural Language Processing
Спасибо! А если не корпус, а что-то готовое для частеречной разметки? По белорусскому у меня вообще ноль информации, к сожалению.
источник

s

sjdc in Natural Language Processing
как минимум в universaldependencies.org есть большой Treebank размеченных белорусских текстов.

https://universaldependencies.org/be/index.html
источник

N

Nadia in Natural Language Processing
я имею в виду готовый инструмент, которому можно передать POS и feats, а на выходе получить слово в соответствующей форме (как у pymorphy2 в методе inflect(), такое что-то). Или передать лексему и получить всю парадигму изменений.
источник

KS

Konstantin Smith in Natural Language Processing
Pullenti также работает с украинским
источник

N

Nadia in Natural Language Processing
Спасибо, смотрю!
источник

KS

Konstantin Smith in Natural Language Processing
Есть аналогичный чат на украинском: https://t.me/nlp_uk . За эту рекомендацию достаточно 100$...
источник

NK

Nikolay Karelin in Natural Language Processing
Насколько я знаю, готовых инструментов нет совсем :(
источник

N

Nadia in Natural Language Processing
Очень печально, впрочем, я так и предполагала :|
источник

NK

Nikolay Karelin in Natural Language Processing
Точнее с белорусским как - нужны хотя бы словари, и размеченные данные, но этим толком никто не занимается. Знаю про одну группу в НАНБ, но они (почти?) ничего не выкладывают в открытый доступ.
источник

N

Nadia in Natural Language Processing
А то, что выше упоминалось в UD и bnkorpus? Я сама не смотрела, что там, так как это не совсем то, что мне нужно, к сожалению.
источник

KL

Kiryl Liaushun in Natural Language Processing
для белорусского есть вот такое от лабы Гецевича, да и всегда можно попробовать договориться
https://www.corpus.by/PartOfSpeechTagger/?lang=en
источник

NK

Nikolay Karelin in Natural Language Processing
Я про эту группу в НАН и говорю. К сожалению, они дают только сервис с API, а не открытые данные.
источник

KL

Kiryl Liaushun in Natural Language Processing
источник

KL

Kiryl Liaushun in Natural Language Processing
ну и опять же, всегда можно попробовать связаться
источник

N

Nadia in Natural Language Processing
Спасибо, попробовала!
источник

N

Nadia in Natural Language Processing
Большое всем спасибо за помощь, я совершенно не ориентируюсь в белорусском NLP :)
источник

МА

Максим Антонов... in Natural Language Processing
Привет. Играюсь с yargy с грамматиками.
Не могу понять откуда он парсит неверные последовательности.
источник

МА

Максим Антонов... in Natural Language Processing
на мой взгляд тут есть последовательности не заданные правилами.
источник

МА

Максим Антонов... in Natural Language Processing
такие как :
может и
теплопередача в
вставляется в

Как мне понять что я сделал не так?
источник

МА

Максим Антонов... in Natural Language Processing
И еще вопрос по yargy. Хочется иметь такое правило
NOUN ЛЮБАЯ_ГРАММЕМА NOUN

Ну как  пример. Хочется пропускать при парсинге граммемы. В идеале в некоторых случаях из бы захватывать, а в некоторых удалять из результирующего match.

Есть такая возможность?
источник