сорри .. а подскажите как это делать? я ранее не сталкивался
Если я правильно понял, нужно во время обучения взять об. выборку, разделить её на фолды (это внешний цикл) , для каждого фолда находить для каждой категории среднее таргета через ещё одно разбиение остальной части об. выборки. На этом ещё одном разбиении (внутренний цикл) берётся каждый фолд и находится среднее для каждой категории по оставшейся части. Потом для каждой категории значения усредняются по все фолдам внутреннего цикла. Эти значения и пойдут как среднее для фолда на внешнем цикле. Так по всем фолдам внешнего цикла. То есть, на обучении у нас кросс-валидация в кросс-валидации, вложенные циклы. Все это улучшает обучение. На тесте мы просто находим средние по категориям на всей об. выборке сразу и заполняем тест. Могу ошибаться... Поправьте, если что, ещё попробую применить скоро