Size: a a a

2018 October 12

DT

Dmitry Torshin in catboost_ru
вчера зарелизили 0.10.3, теперь информация про неиспользуемые фичи из модели не дропается
источник
2018 October 13

AB

Alexandr Bocharov in catboost_ru
Добрый день. Подскажите, пожалуйста, есть binary classification модель обученная на ~50М записей, 50/50 распределение 0/1 label в training 80%/test 20% data set,  11 categorical, 3 numerical features, 20 iterations. Все метрики выглядят слишком хорошо даже если применить модель на данных которых модель не видела до этого, logloss ~0.01, accuracy/precision ~0.99, и другие метрики. Но что то подсказывает что слишком все хорошо. Больше фич (40 штук) добавляли и картина примерно такая же. Как бороться, на что посмотреть, или улучшать сам дата сет как то?
источник

AD

Anna Veronika Dorogush in catboost_ru
Только что прошел туториал на PyData, фото победителей контеста и человека с лучшим вопросом
источник

AD

Anna Veronika Dorogush in catboost_ru
источник

AD

Anna Veronika Dorogush in catboost_ru
источник

AD

Anna Veronika Dorogush in catboost_ru
Все молодцы, ура!
источник

VB

Valeriy Babushkin in catboost_ru
Антон победил , здорово
источник
2018 October 20

AS

Alexsey Shestacov in catboost_ru
Вопрос по катбусту. Насколько хорошо катбуст работает с фичами с выской корреляцией?
источник
2018 October 21

MK

Maxim Khrisanfov in catboost_ru
Просьба к разработчикам обратить внимание на issue #474. Фича Shap values для Multiclass была добавлена в v0.9, но по факту сейчас это не работает.
источник
2018 October 22

AD

Anna Veronika Dorogush in catboost_ru
Maxim Khrisanfov
Просьба к разработчикам обратить внимание на issue #474. Фича Shap values для Multiclass была добавлена в v0.9, но по факту сейчас это не работает.
это уже пофиксили. В issue отписались
источник

MK

Maxim Khrisanfov in catboost_ru
спасибо
источник
2018 October 25

NN

Nazarii Nyzhnyk in catboost_ru
Здравствуйте!
Помогите пожалуйста:
Пробую зафитить catboost регрессию через R на датасете 407 переменных, 13000 наблюдений.

Гиперпараметры:
depth = 11;
learning_rate = 0.0252788636138954;
iterations = 22;
l2_leaf_reg = 0.647743362050963;
rsm = 0.8;
border_count = 110

В который раз абортится сессия R. На некоторых параметрах фит происходит нормально, на некоторых (как показано выше), не происходит. Пробовал и на windows, и на Linux.

Catboost очень чувствительный к параметрам?
Если да, то как лучше их задавать?
источник

A

Andrey in catboost_ru
Ерроры какие-то видно?
источник

NN

Nazarii Nyzhnyk in catboost_ru
Нет, просто session abort
источник

A

Andrey in catboost_ru
На нескольких машинах проверял? А на линуксе?
источник

NN

Nazarii Nyzhnyk in catboost_ru
Проверяли на разных машинах
На одной windows 10,
На другой centos linux 7
источник

ND

Nikita Dmitriev in catboost_ru
Если глубину ( depth ) поставить маленькую, то все равно падает?
источник

AD

Anna Veronika Dorogush in catboost_ru
Давайте в issues с падениями
источник
2018 October 26

MK

Maxim Khrisanfov in catboost_ru
всем привет! какое число деревьев является оптимальным? например overfitting detector при early_stopping_rounds=5 срабатывает только после 8000 итераций это нормально? или лучше повышать глубину деревьев и понижать l2_leaf_reg?
источник

SK

Stanislav Kirillov in catboost_ru
Если нет бюджета на время применения в продакшне, то можно учить настолько большую модель, насколько это дает прирост по качеству
источник