Size: a a a

2018 October 01

SK

Stanislav Kirillov in catboost_ru
Dmitry Torshin
@kizill так вроде на итоговую модель процесс обучения никак не должен влять. разница лишь только в том, как делать сплиты.
смотри, допустим у тебя train = '1\ta' test = '0\tb\n1\t\a'
источник

SK

Stanislav Kirillov in catboost_ru
использовать полное или неполное количество уникальных значений катфичи не является утечкой таргета из теста и не должно приводить к переобучению. но в модели при skiptest в табличке ctr будет только 'a':1, а при full будет 'a':2,'b';1
источник

SK

Stanislav Kirillov in catboost_ru
поэтому результат применения модели будет разный.
источник

SK

Stanislav Kirillov in catboost_ru
мы anyway это изменим, чтоб людей не смущать :)
источник

DT

Dmitry Torshin in catboost_ru
Результат модели разный. Я к тому что если взять уже обчуненную модель(не важно каким образом), то результаты должны сопадать(эти две модели конечно будут слегка отличаться).
источник

SK

Stanislav Kirillov in catboost_ru
это да
источник

SK

Stanislav Kirillov in catboost_ru
это было про подсчет метрик на лерне
источник

DT

Dmitry Torshin in catboost_ru
по факту skiptest явно нужно указывать только в случае каких-то временных зависимостей в данных.
источник

AD

Anna Veronika Dorogush in catboost_ru
Sergei Fironov
значение метрики для определенного числа деревьев отличается от метрики, посчитанной на валидационном сете при том же числе деревьев.
На валидационном такого не должно быть. На трейне это нормально, если катфичи есть, тк там счетчики считаются по перестановке. Ты уверен, что у тебя именно на валидации метрики отличались? Если да, то сделай issue и расшарь код, посмотрим, что там случилось.
источник

SK

Stanislav Kirillov in catboost_ru
я посмотрел на код, там у @Sergeif_239 была ошибка
источник

SF

Sergei Fironov in catboost_ru
Да, я перетестирую
источник
2018 October 02

В

Витя in catboost_ru
Привет, я получил важность признаков модели, но их количество меньше числа признаков в трейне, с чем это связано?
источник

VB

Valeriy Babushkin in catboost_ru
так и хочется поштутить что это неважно
источник

В

Витя in catboost_ru
Это может быть связано с тем, что в некоторых признаках 70% нанов?)
источник

JS

Jury Sergeev in catboost_ru
))
источник

В

Витя in catboost_ru
Valeriy Babushkin
так и хочется поштутить что это неважно
🥄(это почти нож)
источник

AD

Anna Veronika Dorogush in catboost_ru
Витя
Привет, я получил важность признаков модели, но их количество меньше числа признаков в трейне, с чем это связано?
Это значит, что часть признаков не была использована в модели
источник

AD

Anna Veronika Dorogush in catboost_ru
те, которых нет в fstr-ах
источник

В

Витя in catboost_ru
Anna Veronika Dorogush
те, которых нет в fstr-ах
Спасибо, буду знать)
источник

В

Витя in catboost_ru
@annaveronika cat_features не поддерживают nan?
источник