Добрый день. Бинарная классификация. Есть числовой признак который не NULL только у 0.5% от выборки. Который, к тому же, не очень сильно разделяет выборку по классам. Однако для некоторых объектов он внезапно становится решающим у catboost'a. В какую сторону следует копать чтобы узнать почему?
Добрый день. Бинарная классификация. Есть числовой признак который не NULL только у 0.5% от выборки. Который, к тому же, не очень сильно разделяет выборку по классам. Однако для некоторых объектов он внезапно становится решающим у catboost'a. В какую сторону следует копать чтобы узнать почему?
может он в комбинаии с каким-то другим признаком отлично разделяет выборку?
по Харреллу, для классификации - 200 событий (наблюдений из миноритарного класса зависимой переменной) на переменную. Если обучающая выборка или последовательность из обучающих блоков содержит 10000 событий, 50 переменных, со скрипом проходим. Любое преобразование переменной - считаем переменную за две. Для логрега - 20 событий на переменную.
если в лабе, то там вроде пока не пофиксили эту траблу, но могу ошибаться (не тестил на последних версия) а если в простом юпитере, то нужно импортнуть некоторые части для визуализации
по Харреллу, для классификации - 200 событий (наблюдений из миноритарного класса зависимой переменной) на переменную. Если обучающая выборка или последовательность из обучающих блоков содержит 10000 событий, 50 переменных, со скрипом проходим. Любое преобразование переменной - считаем переменную за две. Для логрега - 20 событий на переменную.
Всем привет! Решил собрать catboost, он в процессе ходит в https://sandbox.yandex-team.ru/, который не доступен (как минимум снаружи яндекса). К кому можно с этой проблемой стукнуться?