Size: a a a

2020 May 27

ND

Nikita Dmitriev in catboost_ru
Всем привет!
Приглашаем всех на наш туториал по новым фичам, который пройдет 4 июня в формате вебинара:
https://events.yandex.ru/events/tutorial-catboost-04-06-2020?from=tg_catboost
источник

sg

sergey g in catboost_ru
Добрый день, пытаюсь реализовать собственную функцию потерь на C++ (Adding custom per-object objective function tutorial ). по инструкции (https://github.com/catboost/tutorials/blob/master/custom_loss/custom_metric_tutorial.md)

Методы создал CalcDer and CalcDer2, но

не понятно как создать класс TUserDefinedPerObjectError и как установить парметры (set the parameter loss_function with the value of UserPerObjMetric ).

Подскажите, пожалуйста, как это реализовать. Будет очень полезно если будет пример.😊
источник

MF

Maxim FromSiberia in catboost_ru
Как работают эти коэффициенты? Как из них learning rate получается?
источник

sg

sergey g in catboost_ru
@annaveronika
Есть ли разница в производительности (времени расчёта) между кастомной функцией потерь, написаной на C++ и написанной на python. Когда нужно писать на C++?
источник

AD

Anna Veronika Dorogu... in catboost_ru
да, на c++ будет работать гораздо быстрее
источник

sg

sergey g in catboost_ru
Anna Veronika Dorogush
да, на c++ будет работать гораздо быстрее
Спасибо большое.

По C++ есть вопрос по реализации.
не понятно как создать класс TUserDefinedPerObjectError и как установить парметры (set the parameter loss_function with the value of UserPerObjMetric ).

Подскажите, пожалуйста, как это реализоват?. Будет очень полезно если будет пример.😊
источник

AD

Anna Veronika Dorogu... in catboost_ru
нужно смотреть в туториале
источник

SN

Sergey Novozhilov in catboost_ru
Здравствуйте!
источник

SN

Sergey Novozhilov in catboost_ru
get_roc_curve(model, en.train_pool, plot=True, ) есть ли возможность как-то подписать график? Параметр title или что-то в этом роде?
источник
2020 May 28

II

Ivan Ilin in catboost_ru
Anna Veronika Dorogush
нужно смотреть в туториале
Добрый день! Порекомендуйте пожалуйста качественный туториал по мультиклассовой классификации. В документации не хватает примеров использования на реальных данных и подходов к настройке гиперпараметров, которых большое количество. Сделать практические выводы из описания параметров бывает непросто. Например вот такие пассажи “The amount of randomness to use for scoring splits when the tree structure is selected. Use this parameter to avoid overfitting the model.
The value of this parameter is used when selecting splits. On every iteration each possible split gets a score (for example, the score indicates how much adding this split will improve the loss function for the training dataset). The split with the highest score is selected.
The scores have no randomness. A normally distributed random variable is added to the score of the feature. It has a zero mean and a variance that decreases during the training. The value of this parameter is the multiplier of the variance.”
USer Guide должен быть User friendly!
источник
2020 May 29

AB

Artem Boyarintsev in catboost_ru
Коллеги, добрый день. Подскажите, а намеренно ли сделано то, что текстовых фич нет в model.feature_names_?
источник

AD

Anna Veronika Dorogu... in catboost_ru
Не успели их туда добавить видимо, сделай, пожалуйста, issue на гитхабе, чтобы не потерялось
источник

AB

Artem Boyarintsev in catboost_ru
Anna Veronika Dorogush
Не успели их туда добавить видимо, сделай, пожалуйста, issue на гитхабе, чтобы не потерялось
источник
2020 May 30

MS

Mary Simpson in catboost_ru
Coool event
источник
2020 May 31

VM

Vitaliy Malcev in catboost_ru
подскажите как grid_search с cat_features делать?
источник

ДД

Дима Драгфри... in catboost_ru
Vitaliy Malcev
подскажите как grid_search с cat_features делать?
Если я правильно понял вопрос, то когда делаешь фит указываешь помимо параметров обучения еще и кат-фичи.
Для примера:
clf_grid.fit(X_train, y_train, cat_features=cat_features)
источник
2020 June 01

VB

Victor Bartel in catboost_ru
Добрый день,
Подскажите пожалуйста, как CatBoost работает при использовании модели с категориями которые никогда не встречал при обучении модели.

Например у вас есть регрессионная модель для оценки стоимости авто с категорией "тип топлива", и в обучающей выборке у вас не было информации о машинах с типом топлива GPL. Я бы хотел досконально разобраться и понять как поведет себя модель при запросе на оценку стоимости авто с категорией топлива GPL исходя из того что категорические данные конвертируются в числа. Во что и как будет конвертирована, доселе невиданная, категория.

Заранее вам благодарен.
источник

p

pa_antya in catboost_ru
Victor Bartel
Добрый день,
Подскажите пожалуйста, как CatBoost работает при использовании модели с категориями которые никогда не встречал при обучении модели.

Например у вас есть регрессионная модель для оценки стоимости авто с категорией "тип топлива", и в обучающей выборке у вас не было информации о машинах с типом топлива GPL. Я бы хотел досконально разобраться и понять как поведет себя модель при запросе на оценку стоимости авто с категорией топлива GPL исходя из того что категорические данные конвертируются в числа. Во что и как будет конвертирована, доселе невиданная, категория.

Заранее вам благодарен.
Я не знаю как оно реализовано в катбуст, но есть из принципа, что кат в числа, то должно пойти по ветке else в ветвлении, или может быть вызвано исключение какое-нибудь.
Вы сами не пробовали запускать код?
источник

SF

Stepan Frolov in catboost_ru
Добрый день.
Обнаружил, что при кросс-валидации catboost использует процессор (i5 3550) на 10-20%. Причем нагрузка равномерно распределена на все ядра. При этом при обычном обучении все ядра и процессор в целом используется по максимуму. Нормально ли это, и если нет, то что можно с этим сделать?
источник

SK

Stanislav Kirillov in catboost_ru
Victor Bartel
Добрый день,
Подскажите пожалуйста, как CatBoost работает при использовании модели с категориями которые никогда не встречал при обучении модели.

Например у вас есть регрессионная модель для оценки стоимости авто с категорией "тип топлива", и в обучающей выборке у вас не было информации о машинах с типом топлива GPL. Я бы хотел досконально разобраться и понять как поведет себя модель при запросе на оценку стоимости авто с категорией топлива GPL исходя из того что категорические данные конвертируются в числа. Во что и как будет конвертирована, доселе невиданная, категория.

Заранее вам благодарен.
Если значений катфичи было меньше, чем one hot max size - то в случае нового, невиданного до этого значения просто везде в сплитах дерева, использующих значения этой фичи мы пойдем условно "налево". Для счетчиков проще сослаться на документацию: https://catboost.ai/docs/concepts/algorithm-main-stages_cat-to-numberic.html , но если вкратце, то мы будем использовать prior
источник