Телеграмм чат группы catboost

И ещё хотел спросить, можно ли как-то получить результат не в виде графика, а в виде таблицы , вроде такого: фича 1 = 28; фича 2 = 42..., => класс 1 ?

источник

16:54пожаловаться #9

Young Freud 💎 in catboost_ru

Просто, чтобы мне точно сказали, какое значение к какому предсказанию приведёт :)

источник

16:55пожаловаться #10

Young Freud 💎 in catboost_ru

Или может кто-нибудь объяснить, как интерпретировать эти результаты? Вот у меня есть два класса и 277 фич, как понять, какое значение и какой фичи влияет на результат классификации? :)

источник

19:23пожаловаться #11

Dmitriy Kruchinin in catboost_ru

Серые точки это баг библиотеки SHAP https://github.com/slundberg/shap/issues/406

GitHub

shap.summary_plot displaying gray plot · Issue #406 · slundberg/shap

I'm facing this issue where the features are not getting the expected blue and red colors. Does anyone have any idea why this might be so? Thank you!

источник

19:30пожаловаться #12

Anna Veronika Dorogush in catboost_ru

Серые точки рисуются для строк и нанов. Если катфичи строковые, то тоже будет серый цвет.

источник

19:32пожаловаться #13

Young Freud 💎 in catboost_ru

Anna Veronika Dorogush

Серые точки рисуются для строк и нанов. Если катфичи строковые, то тоже будет серый цвет.

А насчёт второго вопроса? :)

источник

19:36пожаловаться #14

Dmitriy Kruchinin in catboost_ru

SHAP показывает насколько изменение конкретного признака влияет на изменение предсказания модели

источник

19:48пожаловаться #15

Dmitriy Kruchinin in catboost_ru

На графике признаки отсортированы по этой характеристике, то есть самый верхний влияет больше всего, нижний меньше всего

источник

19:49пожаловаться #16

Dmitriy Kruchinin in catboost_ru

Надо понимать что это анализ модели а не анализ исходного датасета, например, если есть скоррелированные признаки очень важные, то они по важности могли уехать вниз из-за random strength в сплитах

источник

19:52пожаловаться #17

Young Freud 💎 in catboost_ru

Понял, спасибо большое :)

источник

23:04пожаловаться #18

2019 November 07

Ivan Lyapin in catboost_ru

Привет. Пытаюсь разобраться как считаются feature importances.

Possible values:
FeatureImportance: Equal to PredictionValuesChange for non-ranking metrics and LossFunctionChange for ranking metrics (the value is determined automatically)

Что здесь имеется в виду под ranking? Logloss - это non-ranking?

источник

12:47пожаловаться #19

Ivan Lyzhin in catboost_ru

Вот ranking (для задач ранжирования) метрики: https://catboost.ai/docs/concepts/loss-functions-ranking.html
Остальные, соответственно, не ranking

catboost.ai

Ranking: objectives and metrics - CatBoost. Documentation

Pairwise metrics use special labeled information — pairs of dataset objects where one object is considered the “winner” and the other is considered the “loser”. This information might be not exhaustive (not all possible pairs of objects are labeled in such a way). It is also possible to specify the weight for each pair.

источник

12:56пожаловаться #20