Size: a a a

2019 May 12

Bo

Blen obema in catboost_ru
Aнтон
А что означает - "самый вероятный категориальный фактор"?
наверное имелось в виду "самое вероятное значение категориального фактора"
источник

A

Aнтон in catboost_ru
Sunsh1ne
Всем привет.
Подскажите, пожалуйста, можно ли у уже обученной модели (бинарная классификация) узнать самый вероятный категориальный фактор, если все остальные факторы известны. То есть по сути известно все факторы и даже к какому классу относится пример, но не известен один из факторов.
спасибо
Если подразумевается, что у нас есть прогнозы, но нету самого объекта модели, которая выдаёт предсказания, то тогда - построением отдельной модели, причём это уже задача кластеризации с неизвестным кол-вом кластеров. Если достаточно восстановить только те значения, которые оказались значимыми с точки зрения первичной модели, то можно использовать кол-во уникальных вариантов прогнозов как оценку сверху для кол-ва кластеров. Если же сама модель тоже есть (т.е. некий обученный катбуст, например как объект в питоне), то можно выдрать из обученного ансамбля деревьев сами значения категорий и, перебирая их, нагенерить достаточно большую выборку и обучить на ней отдельную модель многоклассовой классификации, и параллельно можно упростить себе задачу и заполнить константами значения тех признаков, которые не встречаются в деревьях глубже, чем неизвестный признак
источник

A

Aнтон in catboost_ru
И еще мне кажется что эту задачу можно сформулировать как задачу для криптоанализа
источник

A

Aнтон in catboost_ru
Если совсем упороться
источник
2019 May 13

IP

Igor Petrov in catboost_ru
Как понять отрицательные значения Score в
catboost.eval.evaluation_result
?
источник
2019 May 14

DZ

Dan Zorn in catboost_ru
Всем привет. Дата-сет весит всего 12ГБ, 9 катфичей, используется карточка с объемом оперативки 8ГБ, при попытке завести регрессор, выдает ошибку not enough memory for tree-ctrs. Есть ли какие-то варианты без изменения значений параметра max_ctr_complexity и увеличения оперативки на ГПУ что-то сделать?
источник

AD

Anna Veronika Dorogush in catboost_ru
можно попробовать max_ctr_complexity=1
источник

AD

Anna Veronika Dorogush in catboost_ru
а, без изменений max_ctr_complexity
источник

DZ

Dan Zorn in catboost_ru
+ =)
источник

DZ

Dan Zorn in catboost_ru
с изменением этого параметра падает точность
источник

AD

Anna Veronika Dorogush in catboost_ru
сколько строк?
источник

AD

Anna Veronika Dorogush in catboost_ru
в датасете
источник

AD

Anna Veronika Dorogush in catboost_ru
если меньше 50к, то попробуй поставить boosting_type='Plain'
источник

AD

Anna Veronika Dorogush in catboost_ru
еще можно уменьшить gpu_ram_part
источник

DZ

Dan Zorn in catboost_ru
30кк строк
источник

AD

Anna Veronika Dorogush in catboost_ru
тогда только gpu_ram_part
источник

DZ

Dan Zorn in catboost_ru
спасибо, сейчас попробуем
источник

VE

Vasily Ershov in catboost_ru
еще можно gpu_cat_features_storage = CpuPinnedMemory
источник

DZ

Dan Zorn in catboost_ru
👍
источник

VE

Vasily Ershov in catboost_ru
но все равно может не зватить, но стоит проверить
источник