Size: a a a

2018 December 14

MK

Maxim Khrisanfov in catboost_ru
кстати эта проблема была не только с функцией predict, но и с get_feature_importance (shap values)
источник

MK

Maxim Khrisanfov in catboost_ru
если не сложно поправьте это тоже плиз :)
источник

SK

Stanislav Kirillov in catboost_ru
ок, мы тогда  не будем issue закрывать пока не пофиксим
источник

A

Andrey in catboost_ru
кастомный гридсерч: https://github.com/statist-bhfz/catboost_tune/blob/master/catboost_tune.R Функцию cv_split не показываю, есть много вариантов разбивки для кроссвалидации. Можно даже взять за основу caret::createFolds
источник

A

Andrey in catboost_ru
все крутится на data.table, на фолды я тоже разбиваю с использованием этой библиотеки
источник

DB

Dmitry Baksheev in catboost_ru
Oleh Yashchuk
Такая ошибка:
Error in catboost.from_matrix(as.matrix(preprocessed), label, cat_features,  :
 Unsupported label type, expecting double or int, got: integer
Это сообщение отсюда, непонятно как одновременно typeof(label) is integer и !is.integer(label).  Идеи есть?
источник

OY

Oleh Yashchuk in catboost_ru
Код я смотрел. Идей нет.
источник

OY

Oleh Yashchuk in catboost_ru
Andrey спасибо! позже разберусь
источник
2018 December 15

YS

Yaroslav Sviridov in catboost_ru
Добрый день! Подскажите пожалуйста, если мне нужно сравнивать два объекта(без кат фичей) то мне стоит подавать разность объектов по каждой фиче или просто последовательно фичи у обоих объектов?
источник

AK

Andrei Khropov in catboost_ru
Yaroslav Sviridov
Добрый день! Подскажите пожалуйста, если мне нужно сравнивать два объекта(без кат фичей) то мне стоит подавать разность объектов по каждой фиче или просто последовательно фичи у обоих объектов?
Добрый!
> мне нужно сравнивать два объекта(без кат фичей)
что имеется ввиду? Нужно натренировать модель с помощью которой можно сравнивать объекты?
источник

YS

Yaroslav Sviridov in catboost_ru
Andrei Khropov
Добрый!
> мне нужно сравнивать два объекта(без кат фичей)
что имеется ввиду? Нужно натренировать модель с помощью которой можно сравнивать объекты?
Да, верно. Модель будет сравнивать объекты.
источник

AK

Andrei Khropov in catboost_ru
А объекты как-то объединены в группы (например, это ответы на запрос)?
источник

YS

Yaroslav Sviridov in catboost_ru
У объектов есть вещественные фичи, категориальных нет, объекты не объединены в группы.
источник

AK

Andrei Khropov in catboost_ru
Ок. CatBoost тренирует формулу, которая является суммой деревьев решений, поэтому ее значения в общем случае не зависят линейно от фичей, поэтому их суммирование или вычитание не имеет смысла. Для данных с группами в catboost есть режимы где можно тренировать прямо на обучающей выборке пар если указать в качестве loss_function PairLogit или PairLogirPairwise (https://tech.yandex.com/catboost/doc/dg/concepts/loss-functions-docpage/#loss-functions__ranking). Если групп нет, то тогда видимо стоит использовать просто регрессию и ранжировать объекты по значению формулы.
источник

YS

Yaroslav Sviridov in catboost_ru
Спасибо большое :)
источник

AK

Andrei Khropov in catboost_ru
Можно также попробовать учить бинарный классификатор для объектов-пар, который будет предсказывать является ли в паре первый объект больше второго. Соответственно, в рамках этой задачи объект = пара и фичи уже для пары, тут могут уже быть разности фичей объектов в паре или какие-то другие комбинации значений фичей объектов в паре можно пробовать.
источник
2018 December 17

EK

Egor Krasheninnikov in catboost_ru
Добрый день!
Есть тут кто-нибудь, кто сталкивался с  такой проблемой: катбуст стабильно выдает точность на валидации больше, чем на трэйне, если не выкручивать глубину в достаточно большие числа (10-12)
При этом сплиты делаются правильно
Данных для валидации тоже достаточно по количеству
Оценка точности производится правильно
Подскажите, чем это может быть вызвано
источник

AD

Anna Veronika Dorogush in catboost_ru
если обучаешься с катфичами, то по ним считаются счетчики на трейне. На трейне они считаются по перестановке, а на валидации по всему обучающему множеству.
источник

AD

Anna Veronika Dorogush in catboost_ru
поэтому эти фичи у валидации сильнее, чем у трейна
источник

EK

Egor Krasheninnikov in catboost_ru
То есть обработка катфечей на трейне и на тесте происходит по разному?
источник