Добрый день. Посоветуйте инструмент или связку, с помощью которой можно решить данную задачу.
Есть много технических документов, например, статьи об электродвигателях.
Инструмент должен по этим данным:
1. Извлечь объект - двигатель
2. Сделать вывод, что двигатель бывает синхронный и асинхронный
3. И далее из нового документа парсить о каком двигателе идёт речь: синхронном или асинхронном
Задача без учителя, есть только сами статьи.
Объем каждой статьи около 20 тыс символов
Количество статей по одной тематике (например, двигатели): 10 тыс