Size: a a a

2019 May 15

AD

Anna Veronika Dorogush in catboost_ru
не хватает гпу памяти, поэтому ошибка
источник

AV

Andrey Vetrov in catboost_ru
На CPU - нет ошибки, на GPU - есть, это значит не хватает памяти у видеокарты?
источник

AV

Andrey Vetrov in catboost_ru
ок, спасибо
источник

VE

Vasily Ershov in catboost_ru
Andrey Vetrov
На CPU - нет ошибки, на GPU - есть, это значит не хватает памяти у видеокарты?
да
источник

AD

Anna Veronika Dorogush in catboost_ru
вообще советы такие:
How to overcome "Out of memory" error in GPU training?
- Set the boosting_type parameter to 'Plain'. It is set to 'Ordered' by default for datasets with less then 50 thousand objects. The Ordered scheme requires a lot of memory.
- Set the max_ctr_complexity parameter to either 1 or 2, if the dataset has categorical features.
- Decrease the value of the gpu_ram_part parameter
- Set the gpu_cat_features_storage parameter to CpuPinnedMemory
- Check that the dataset fits in GPU memory. The quantized version of the dataset is loaded into GPU memory. This version is much smaller than the initial dataset. But it can be larger then available memory size if the dataset is big enough.
- Decrease depth value, if it is greater then 10. Each tree contains 2^n leaves if the depth is set to n, because CatBoost builds full symmetric trees by default. The recommended depth is 6, which works well in most cases. In rare cases it's useful to increase the depth value up to 10.
источник

AD

Anna Veronika Dorogush in catboost_ru
Скоро это доедет до документации, но пока текстом.
источник

IC

Igor Cage in catboost_ru
При конфигурировании датасета можно ли сделать сложные метки, с несколькими значениями?

обычные метки
train_labels = [ 100, 33, 100, 33 ]

нужно примерно в таком виде (выдает ошибку на строке model.fit...)
train_labels = [ [100, 0], [33, 0], [100, 0], [33, 0] ]
источник

AD

Anna Veronika Dorogush in catboost_ru
Нельзя
источник

AD

Anna Veronika Dorogush in catboost_ru
А зачем именно?
источник
2019 May 16

AD

Anna Veronika Dorogush in catboost_ru
Igor Petrov
Как понять отрицательные значения Score в
catboost.eval.evaluation_result
?
Пропустили это сообщение. Сейчас Score - это значение изменения лосса. Хороший скор может быть как положительным, так и отрицательным в зависимости от того, лосс надо максимизировать или минимизировать. Также скор может быть плохим, и это значит, что фича вредная. Ну или модель сильно недообученная, и там близкое к нулю значение, фича просто не доиспользована в модели.
источник

AD

Anna Veronika Dorogush in catboost_ru
Скоро поменяем, чтобы был положительный - это хорошо, отрицательный - это плохо. Тк этот вопрос не в первый раз возникает.
источник

IP

Igor Petrov in catboost_ru
Anna Veronika Dorogush
Пропустили это сообщение. Сейчас Score - это значение изменения лосса. Хороший скор может быть как положительным, так и отрицательным в зависимости от того, лосс надо максимизировать или минимизировать. Также скор может быть плохим, и это значит, что фича вредная. Ну или модель сильно недообученная, и там близкое к нулю значение, фича просто не доиспользована в модели.
Из чего он взял тогда, что 10 фича плохая, а 2 фичи не известно?
источник

AD

Anna Veronika Dorogush in catboost_ru
decision good/bad vs unknown принимается по pvalue
источник

AD

Anna Veronika Dorogush in catboost_ru
судя по тому, что много unknown, модель недообученная
источник

IP

Igor Petrov in catboost_ru
Anna Veronika Dorogush
decision good/bad vs unknown принимается по pvalue
наверное не совсем, так бы 3 фича была плохая
источник

SZ

Sasha Zhu in catboost_ru
Igor Petrov
Из чего он взял тогда, что 10 фича плохая, а 2 фичи не известно?
А откуда взялась такая таблица?
источник

IP

Igor Petrov in catboost_ru
Anna Veronika Dorogush
судя по тому, что много unknown, модель недообученная
это да, тестовый вариант
источник

IP

Igor Petrov in catboost_ru
Sasha Zhu
А откуда взялась такая таблица?
 from catboost.eval.evaluation_result import *
logloss_result = result.get_metric_results('Logloss')
logloss_result.get_baseline_comparison(
   ScoreConfig(ScoreType.Rel, overfit_iterations_info=False)
)
источник

AD

Anna Veronika Dorogush in catboost_ru
Igor Petrov
наверное не совсем, так бы 3 фича была плохая
3 фича отмечена как Good
источник

AD

Anna Veronika Dorogush in catboost_ru
pvalue=0.004
источник