Доброго вечера. Предположим, что у меня есть несколько классов для текстов с очень ограниченным числом примеров (3-5 страниц на 500-1000 символов для каждого класса, но желательно сделать так, чтобы для добавления нового класса в систему классификации было достаточно одной страницы).
Какой инструмент можно использовать в этой ситуации? Я планировал делать doc2vec и простую метрику дистанции для поиска наиболее близкого к тестовому примеру класса, но точность оставляет желать лучшего. TFIDF + вектора поддержки на классификации пробовал, но с этим подходом нужно очень много документов для формирования словаря, с генерализацией будут проблемы.