Что-то поинтереснее — это, пожалуй, представить данные как граф, где ребро означает связаны ли два ID между собой или нет и решать задачу как линк предикшн. Но это разметки потребует :/
Да, в этом и проблема, что разметки нет) На Хакатоне от Точки как раз была похожая задача, была дана часть графа, а часть связей убрали. Тогда первое место заняли за счёт CatBoost и усреднения сида.