Size: a a a

2019 September 16

d

dePuff in catboost_ru
В одном из своих докладов по catboost Анна-Вероника говорила, что при обучении для catboost можно показать не только train, но и test set.

Как я понял, он вытащит тогда больше информации о распределении фич и это поможет всяким эвристикам.

Как это сделать?

Спасибо
источник

AD

Anna Veronika Dorogush in catboost_ru
Среди числовых фичей, посчитанных по категориальным фичам, есть фича частотность значения катфичи.
Так как она не использует таргет, то ее можно считать на трейн+тест, а не только на трейне.
Для этого в катбусте можно использовать counter_calc_method='Full'
источник

d

dePuff in catboost_ru
Женюсь!
источник

d

dePuff in catboost_ru
Спасибо )
источник

S

Sergio in catboost_ru
Anna Veronika Dorogush
Среди числовых фичей, посчитанных по категориальным фичам, есть фича частотность значения катфичи.
Так как она не использует таргет, то ее можно считать на трейн+тест, а не только на трейне.
Для этого в катбусте можно использовать counter_calc_method='Full'
если правильно понял, все статистики по кат фичам считаются под капотом, нужно только указать кат столбцы?
источник

AD

Anna Veronika Dorogush in catboost_ru
Sergio
если правильно понял, все статистики по кат фичам считаются под капотом, нужно только указать кат столбцы?
да
источник

AD

Anna Veronika Dorogush in catboost_ru
Зачем это в чате? Я думаю, блокировать ли тебя.
источник

SK

Stanislav Kirillov in catboost_ru
Удаляем
источник
2019 September 17

AS

Alexsey Shestacov in catboost_ru
CatBoostError: c:/goagent/pipelines/buildmaster/catboost.gittt/catboost/libs/options/plain_options_helper.cpp:510: Unknown option {calc_feature_importance} with value "true"
источник

AS

Alexsey Shestacov in catboost_ru
где то сломали обратную совместимость?
источник

SK

Stanislav Kirillov in catboost_ru
Это при загрузке модели или при обучении?
источник

AS

Alexsey Shestacov in catboost_ru
from catboost import CatBoost
param = {'loss_function':'YetiRank',
        'learning_rate': .00001,
        'iterations': 1000,
        'depth': 7,
        'use_best_model':True,
        'calc_feature_importance': True,
        'one_hot_max_size' : 20,
        'bagging_temperature' : .7,
        'max_ctr_complexity' : 4 }
model = CatBoost(param)
model.fit(train_pool, eval_set=validation_pool,
   logging_level='Silent',
   plot=True);
источник

SK

Stanislav Kirillov in catboost_ru
Для обучения да, мы ее в 0.9 удалили
источник

SK

Stanislav Kirillov in catboost_ru
источник

AD

Anna Veronika Dorogush in catboost_ru
Breaking changes бывают, мы про них пишем в нотисах. Другое дело, что мы модель не ломаем, чтобы никому прод не сломать.
источник

AS

Alexsey Shestacov in catboost_ru
в этом кейсе возможно стоило бы Warning cделать и не упасть
источник

AD

Anna Veronika Dorogush in catboost_ru
За последние 8 мажорных и неизвестно сколько минорных версий, мы бы ворнинг уже давно заменили на удаление параметра.
источник

AD

Anna Veronika Dorogush in catboost_ru
Но да, мы стараемся сначала ворнинги добавлять, особенно для часто используемых параметров.
источник

AS

Alexsey Shestacov in catboost_ru
CatBoostError: c:/goagent/pipelines/buildmaster/catboost.gittt/catboost/libs/metrics/metric.cpp:4498: metric [RMSE] is incompatible with loss [YetiRank] (not compatible with ranking)
источник

AD

Anna Veronika Dorogush in catboost_ru
Все правильно, текст ошибки отражает проблему - если ты обучаешь ранжирование, то на RMSE смотреть смысла нет
источник