Всем привет, подскажите пожалуйста, есть задача NER : находить в текстах именованные сущности. Что можно применить помимо регулярных выражений? Какие библиотеки (модели) можно задействовать? Тексты на русском языке. Заранее прошу прощения, вопрос от новичка)
https://github.com/natasha/natasha#ner В Наташе тоже есть NER. И в spacy, и в natasha есть возможность добавлять извлечение NER с помощью специальных правил, вдобавок к автоматическому.
Я пробовал использовать Natasha, но вероятно не разобрался во всех возможностях этого проекта. К примеру: мне нужно найти ФИО в тексте. Но не все ФИО распознаются как ФИО ( pos = ‘PROPN’)
Подскажите, пожалуйста, какие есть пакеты в Python для подсчета дескриптивных текстовых фич (кол-во слов, символов, средняя длина слова, % уникальных слов в тексте и тп)? Мигрирую из R и еще не знаком со всеми библиотеками