Size: a a a

2019 July 23

IP

Igor Petrov in catboost_ru
Или со столь малым снижение нет смысла дальше учить?
источник

OS

Oleg Shapovalov in catboost_ru
Не ожидал, что установка весов сильно снизит скорость обучения. Еще не хочется вас увести в неправильную сторону 🙂 Так что я бы попросил прокомментировать разработчиков catboost, как тут правильно поступить (вообще я все еще думаю, что повышать recall странная затея)
источник

AM

Anton Martsen in catboost_ru
Все привет. Обучил модельку с категориальными и числовыми фичами. Вызываю get_feature_importance, подсовываю ему тест-датасет и получаю Feature cat_f_country_iso_code from pool must not be categorical. Чувствую, что решение должно быть каким-то простым
источник

AD

Anna Veronika Dorogush in catboost_ru
судя по тексту ошибки, при обучении эта фича была объявлена как числовая
источник

AD

Anna Veronika Dorogush in catboost_ru
а не категориальная
источник

AM

Anton Martsen in catboost_ru
интересно. сейчас проверю
источник

AM

Anton Martsen in catboost_ru
спасибо за быстрый ответ )
источник

AM

Anton Martsen in catboost_ru
поправчока, все работает ок, но падает при type=ShapValues| LossFunctionChange
источник

AD

Anna Veronika Dorogush in catboost_ru
А сделай, пожалуйста, issue на гитхабе, с примером, как это воспроизвести
источник

MK

Maxim Khrisanfov in catboost_ru
Maxim Khrisanfov
А будет ли в ближайшее время нормальная работа shap values для мультикласса? Сейчас для одного из классов вместо нормальных значений shap values нули, соответственно есть подозрение, что для других классов значения не верны. Я заводил issue еще в феврале https://github.com/catboost/catboost/issues/671 если нет времени на эту таску, то подскажите хотя бы куда смотреть в первую очередь. Очень нужны shap values для мультикласса.
@annaveronika а на мой вопрос ответите? :)
источник

AD

Anna Veronika Dorogush in catboost_ru
Шапы сейчас везде (и в катбусте, и в других библиотеках) считаются для каждого класса отдельно, независимо. То, что это не независимые предсказания, сейчас в шапах не учитывается. У нас для скорости сделано предсказание - константный 0 для первого или последнего класса. Поэтому и шапы там нулевые. Чтобы это поменять, надо придумать, как считать шапы так, чтобы они учитывали то, как мультикласс обучается.
Пока что можно смотреть на шапы k-1 класса.
источник

AD

Anna Veronika Dorogush in catboost_ru
Мы напишем в issue, когда новости будут
источник

MK

Maxim Khrisanfov in catboost_ru
ok, спасибо
источник

MK

Maxim Khrisanfov in catboost_ru
> У нас для скорости сделано предсказание - константный 0 для первого или последнего класса.
@annaveronika то есть если мне нужны вероятности для такого класса, то я получу нули?
источник

IP

Igor Petrov in catboost_ru
Oleg Shapovalov
Не ожидал, что установка весов сильно снизит скорость обучения. Еще не хочется вас увести в неправильную сторону 🙂 Так что я бы попросил прокомментировать разработчиков catboost, как тут правильно поступить (вообще я все еще думаю, что повышать recall странная затея)
Ну скорость то упала, зато есть результат
источник

AD

Anna Veronika Dorogush in catboost_ru
Maxim Khrisanfov
> У нас для скорости сделано предсказание - константный 0 для первого или последнего класса.
@annaveronika то есть если мне нужны вероятности для такого класса, то я получу нули?
Да ты что, нет конечно. Предсказание - сумма деревьев, от нее, чтобы вероятности получить, берется либо сигмоида в бинклассе, либо софтмакс в мультиклассе, чтобы каждую вероятность получить. Поэтому мы и можем 0 поставить в один из классов.
источник

MK

Maxim Khrisanfov in catboost_ru
а, 0 имеется ввиду RawPrediction
источник

AD

Anna Veronika Dorogush in catboost_ru
Да, шапы всегда в RawPrediction суммируются
источник

MK

Maxim Khrisanfov in catboost_ru
понятно
источник

MK

Maxim Khrisanfov in catboost_ru
> Пока что можно смотреть на шапы k-1 класса.
я так и делаю, просто обидно когда всего 3 класса и один выпадает из поля зрения:)
источник