Здравствуйте!
Интересует вопрос
Существует ли какой-либо открытый проект для менеджеринга разных библиотек для извлечения сущностей из текста?
Вот например, я хочу сгруппировать результаты работы StanfordNLP, и Tomita парсера
Хочу в результате указать, какие сущности имеют больший приоритет, или как-то объединять их.
И чтобы можно было бы задавать какие-то общие абстрактные правила для них обоих.
А еще желательно, чтобы можно было запускать их обоих в многопоточном режиме, то есть асинхронно.
Мне видится два варианта ответа:
Первый случай: такая библиотека для менеджеринга действительно есть. Тогда я был бы благодарен за ссылки, а также отзывы о их плюсах и минусах, краткое резюме по его использованию.
Второй случай:
Как вариант, можно использовать например следующую схему: в StanfordNLP добавить NLTK в качестве отдельного анализатора, и дальше использовать средства StanfordNLP для менеджеринга их обоих. Однако, в данном случае нету механизма разрешения приоритетов, то есть я не могу указать, чтобы сущности из StanfordNLP были большим приоритетом, а все остальные - меньшим, так как там не предусмотрено такого механизма.
Есть ли у вас опыт использования NLP библиотеки в качестве менеджера над несколькими разными библиотеками, и если есть, то скажите пожалуйста плюсы и минусы тех или иных
Вообще, было бы интересно посмотреть на реализацию подобного хотя-бы, чтобы понимать как лучше это организовывать
Спасибо за внимание