Всем привет.
Подскажите, пожалуйста, можно ли у уже обученной модели (бинарная классификация) узнать самый вероятный категориальный фактор, если все остальные факторы известны. То есть по сути известно все факторы и даже к какому классу относится пример, но не известен один из факторов.
спасибо
Если подразумевается, что у нас есть прогнозы, но нету самого объекта модели, которая выдаёт предсказания, то тогда - построением отдельной модели, причём это уже задача кластеризации с неизвестным кол-вом кластеров. Если достаточно восстановить только те значения, которые оказались значимыми с точки зрения первичной модели, то можно использовать кол-во уникальных вариантов прогнозов как оценку сверху для кол-ва кластеров. Если же сама модель тоже есть (т.е. некий обученный катбуст, например как объект в питоне), то можно выдрать из обученного ансамбля деревьев сами значения категорий и, перебирая их, нагенерить достаточно большую выборку и обучить на ней отдельную модель многоклассовой классификации, и параллельно можно упростить себе задачу и заполнить константами значения тех признаков, которые не встречаются в деревьях глубже, чем неизвестный признак