Size: a a a

2019 January 23

VE

Vasily Ershov in catboost_ru
а, тогда понятно, SHAP для мультикласса считаются неправильно (и на CPU, и на GPU)
источник

MK

Maxim Khrisanfov in catboost_ru
а будет правильно?)
источник

VE

Vasily Ershov in catboost_ru
починим
источник

MK

Maxim Khrisanfov in catboost_ru
спасибо)
источник

VE

Vasily Ershov in catboost_ru
в мультиклассе вероятность последнего класса однозначно определяется через предыдущий, GPU это использует для ускорения обучения
и у него в итоге «сырые» предсказания ноль на последнем класcе
источник

VE

Vasily Ershov in catboost_ru
а в shap про это забыли
источник

VE

Vasily Ershov in catboost_ru
если обучать MultiClassOneVsAll, то должен корректно считать
источник

MK

Maxim Khrisanfov in catboost_ru
да кстати, раньше замечал что один класс будто отбрасывается, вероятности для него всегда близкие к нулю были
источник

VE

Vasily Ershov in catboost_ru
на GPU всегда ноль. в случае multiclass функции ошибки. надо смотреть на вероятности после софтмакса, а не сырые, чтобы отличались. (аналогично как в бинарной классификации первый класс вычисляется через сырое предсказание нулевого)
источник

MK

Maxim Khrisanfov in catboost_ru
да я вроде не на сырыю смотрел, predict_proba же это софтмакс?
источник

VE

Vasily Ershov in catboost_ru
predict_proba уже должен нормально работать
источник

MK

Maxim Khrisanfov in catboost_ru
а что вобще предпочтительней использовать MultiClass или MultiClassOneVsAll? я заметил что первый намного лучше Logloss дает чем второй
источник

MK

Maxim Khrisanfov in catboost_ru
хотя сейчас запустил ситуация иная, вобщем суть в том что разница в показаниях качества большая
источник

VE

Vasily Ershov in catboost_ru
зависит от задачи и метрик, которая нужна
oneVsAll это обычный one-vs-all, где обучаются бинарные классификаторы один против всех, но в катбусте будет одинаковая структура дерева, отличаться будут листья
MultiClass обучает logloss с softmax’ом для определения вероятностей
logloss у multiclass будет лучше, потому что он его и оптимизирует
а вот другие метрики не факт
источник

MK

Maxim Khrisanfov in catboost_ru
вобщем если нужны вероятности а не классы то надо обучать MultiClass
источник

VE

Vasily Ershov in catboost_ru
ага
источник

MK

Maxim Khrisanfov in catboost_ru
а когда примерно shap values пофиксите в следующем релизе стоит ждать?)
источник

VE

Vasily Ershov in catboost_ru
постараемся
источник

VE

Vasily Ershov in catboost_ru
точнее так: в мажорном то поправим, а в минорном зависит от того, когда и из-за чего его будем делать
источник
2019 January 24

Аa

Андрей amber4eg in catboost_ru
А как у catboost с интерпретируемостью? У меня вот регрессия в отном месте стабильно даёт странный и неожиданный результат. И мне хочется понять, откуда оно такое берётся. Есть такая возможность?
источник