GS
Задача правильно классифицировтаь данные по категориям.
Категории эти - это данные с выборов, явка, кол-во избирателей и т.д.
Беда в том что каждый избирательный участок по своему называет эти категории
Я подумал что проще всего на основе исторических данных смотреть распределение данных и на основе этого классифицировать эти данные.
Инициаторы этого мероприятия предлагают обработку естественного языка, мне кажется это оверинжениринг но все же, интересно, как можно использовать данный метод тут. Я только знаю что вначале слова в векторы, а потом между ними расстояния вроде. Может имеет смысл объединить методы для увеличения точности.