Size: a a a

Natural Language Processing

2021 April 15

DS

Daria Samsonova in Natural Language Processing
источник

MK

Max Kuznetsov in Natural Language Processing
>>> form = "ablt"
>>> phrase = "федеральный конституционный закон"
>>> inflector.inflect(phrase, form)
'федеральным конституционным законом'
>>> form = "gent"
>>> inflector.inflect(phrase, form)
'федерального конституционного закона'

👍  Спасибо
источник

N

Natalia in Natural Language Processing
есть синтаксическая разметка в любом парсере, построенном на тэгсете и стандарте Universal Dependencies

выбирайте: UDPipe, Stanza, Spacy (в который теперь и Stanza встроена)
источник

N

Natalia in Natural Language Processing
о, супер
источник

SS

Sergey Sikorskiy in Natural Language Processing
А откуда взялось именно 27? Вроде, в явном виде это число нигде не не присутствует …
источник

VV

VVS VVS in Natural Language Processing
если как-то не поленюсь порыться на вешнем диске - то достану статью 5-летней давности, по последним тем подсчетам было так
источник

VV

VVS VVS in Natural Language Processing
а, пардон, 21 шт
источник

DS

Daria Samsonova in Natural Language Processing
ой этих семантических ролей... у каждого автора свой набор, классификация и количество)
источник

VV

VVS VVS in Natural Language Processing
но было русское чтиво, где очень хорошо было изложено все, вот это уже на диске
источник

VV

VVS VVS in Natural Language Processing
100% истина 🙂 ток софта нету ни у кого, либо оно было еще на Делфи писано и умерло на старых HDD размером не более 10Гб от 1900 годов рождения компа :)))
источник

VV

VVS VVS in Natural Language Processing
либо все увлеклись ML и забыли, что такое вообще нужно учитывать
источник

SS

Sergey Sikorskiy in Natural Language Processing
Я пытался искать, но с ходу ничего путного не нашлось …
источник

VV

VVS VVS in Natural Language Processing
а вспоминают когда еруда вылезает
источник

DS

Daria Samsonova in Natural Language Processing
ну потому что данных нет с разметкой, а их нет, потому что никто никак не договорится что считать семантической ролью, сколько их и тд... все по-разному их определяют, а  разметить при таких вводных что-то - задача не из легких
источник

VV

VVS VVS in Natural Language Processing
я ж говорю, ток читать старые пейперы конф по ИИ + воссоздать будет относительно дорого и медленно. Даже, думаю, не зазорно было б к гуру пенсионного возраста на кафедрах NLP обратиться
источник

SS

Sergey Sikorskiy in Natural Language Processing
Я - сторонник застывших форм … 🙂
источник

VV

VVS VVS in Natural Language Processing
там в их заначках может оказаться что-то типа старенького корпуса на пару десятков тысяч размеченых фраз
источник

VV

VVS VVS in Natural Language Processing
я уже раз видывал корпус на 12тыс для разыменования противоречий, верю, что в других ВУЗах найдутся и по ролям какие-то материалы
источник

VV

VVS VVS in Natural Language Processing
думаю, есть смысл пролистать сборники Международной конфы «Диалог» на эту тему...
источник

VV

VVS VVS in Natural Language Processing
Кашкина работы, например: http://www.ruslang.ru/doc/kashkin/2013/08.pdf
источник