I
Есть датасет: пациент, 4 диагноза по нему, и указано какой из диагнозов основной.
Нужно построить модель которая будет из 4х диагнозов определять основной.
Обычный классификатор у меня не взлетел, потому-что один и тот же диагноз в разных кейсах может быть 1-м, 2-м , 3-м и 4 по счёту.
Если кодировать dummy, то получается больше 1000 признаков и я не знаю, что в таком случае будет таргетом.
Подскажите куда копать.
Буду признателен за ссылки.
