Size: a a a

Natural Language Processing

2021 May 21

DD

David Dale in Natural Language Processing
Насколько я понял, ему нужен очень узкий класс парафраз: однокоренные, но выраженные разными частями речи.
Но, может быть, я не прав, дождёмся ответа автора вопроса)
источник

SancheZz Мов in Natural Language Processing
А лучше замикстить)
источник

SancheZz Мов in Natural Language Processing
Хуже не будет
источник

IK

Irina Krotova in Natural Language Processing
Если нужно просто склеить пары "сообщать - сообщение", то можно взять из Wiktionary, там есть категория "родственные слова" — это к глаголу "сообщать".
источник

IK

Irina Krotova in Natural Language Processing
https://github.com/nsu-ai/DerivBaseRu

еще, возможно, эта библиотека будет полезна
источник

SK

Sergey Karpov in Natural Language Processing
да,  нужно отнести однокоренные, но выраженные разными частями речи в один кластер. Спасибо за ссылки. Все посмотрю сейчас.
источник

KS

Konstantin Smith in Natural Language Processing
В Pullenti зашит так называемый словарь дериватных групп (их там около 15000), где группа - это набор однокоренных слов разных частей речи (ПРОИЗВОДСТВО ПРОИЗВОДИТЕЛЬ ПРОИЗВОДСТВЕННЫЙ ПРОИЗВОДИТЬ ПРОИЗВЕСТИ ПРОИЗВЕДЕННЫЙ и т.д.). То есть для словоформы можно получить группу, брать из неё первое же слово (обычно существительное), которое и будет "сильной нормализацией". Использование: в классе Pullenti.Semantic.Utils.DerivateService функция FindDerivates - вернёт список групп (т.к. словоформа может входить в несколько групп, но обычно в одну) или null, если не найдено в словаре. Для неизвестных слов может генерировать группы, похожие на существующие.
источник

RS

Ruslan Sabirov in Natural Language Processing
Привет!
На всякий случай напоминаю о вопросе. Может кто-то пропустил)
источник
2021 May 22

A

Alaa in Natural Language Processing
Привет, кто-нибудь может помочь мне развиваться в nlp?  Я новичок в этой области.
источник

DD

David Dale in Natural Language Processing
Привет!
А до какого состояния ты хочешь развиться, и зачем?)
источник

A

Alaa in Natural Language Processing
Я имею в виду, что я сделаю несколько приложений в "Обработке естественного языка", и мне нужны лучшие ресурсы в этой области.
источник

K

Ksenia in Natural Language Processing
«Лучшее» будет зависеть от приложения/задачи, доступных вычислительных ресурсов, данных, миллион всего...
источник

A

Alaa in Natural Language Processing
так как вообще можно начать в nlp?
источник

TM

Toemik Mnemonic in Natural Language Processing
Ну как и везде . Должна возникнуть задача связанная с обработкой естественного языка . При условии что выполняющий ее не имеет знаний в данной области , он вынужден знакомится параллельно как с теоретическими основами, так и с  элементами стэка.
источник

A

Alaa in Natural Language Processing
например, я сделаю программу, использующую nlp и компьютерное зрение для извлечения текста из изображений с помощью (OpenCV и Tesseract), так какие лучшие книги говорят об этой проблеме?
источник

AC

Alexander C in Natural Language Processing
@alexkuk глянь личное сообщение, пожалуйста
источник

K

Ksenia in Natural Language Processing
Это, наверное, скорее задача CV :/ от NLP тут крайне мало
источник

K

Ksenia in Natural Language Processing
И книги — не самый лучший способ быстро найти решение :) я бы искала в постах на медиуме и прямо по репозиториям в гитхабе, если задача на английский текст, а если на русский — тут лучше подскажут, я с русским не работаю :( то есть еще и от языка зависит
источник

K

Ksenia in Natural Language Processing
Вру, когда надо обрабатывать получившийся текст с ошибками, там будет NLP, согласна
источник

A

Alaa in Natural Language Processing
Хорошо, спасибо всем, я действительно использую (Medium, Towards, GitHub и т. Д.), Но я задал вопрос по этому поводу, потому что я все больше и больше ощущал дисперсию: '(
источник