Size: a a a

2019 August 11

MK

Maxim Khrisanfov in catboost_ru
😀
источник

A

Alexander in catboost_ru
Коллеги, добрый вечер! Недавно узнал об этой библиотеке. Какие у вас впечатления о ее эффективности по сравнению с xgboost?
источник

MK

Maxim Khrisanfov in catboost_ru
@azkalot1 а что за задача классификация? и сколько данных если не секрет
источник

MK

Maxim Khrisanfov in catboost_ru
Alexander
Коллеги, добрый вечер! Недавно узнал об этой библиотеке. Какие у вас впечатления о ее эффективности по сравнению с xgboost?
впечатления хорошие, особенно радует то что разработчики тут и на гитхабе отвечают, а по xgboost ответа не дождешься)
источник

A

Alexander in catboost_ru
Верно ли, что в среднем вычисление прогноза по готовым признакам происходит быстрее, чем на xgboost?
источник

SK

Sergey Kolchenko in catboost_ru
Maxim Khrisanfov
@azkalot1 а что за задача классификация? и сколько данных если не секрет
Натягиваю катбуст поверх фичей из b7 в aptos на каггле
источник

SK

Stanislav Kirillov in catboost_ru
Alexander
Верно ли, что в среднем вычисление прогноза по готовым признакам происходит быстрее, чем на xgboost?
Если все делать правильно и использовать симметричные деревья, по скорости применения нас сложно обогнать :)
источник

A

Alexander in catboost_ru
а с сильно зашумленными данными наподобие финансовых рыночных данных catboost не хуже xgboost справляется, не делился кто-нибудь впечатлениями из пользователей?
источник

A

Alexander in catboost_ru
скажем lightgbm хуже xgboost, хотя и быстрее обучается
источник

MK

Maxim Khrisanfov in catboost_ru
Alexander
скажем lightgbm хуже xgboost, хотя и быстрее обучается
если у тебя есть категориальные признаки, то xgboost не должен быть лучше по качеству, так-как он с ними не умеет работать, насколько я помню
источник

SK

Sergey Kolchenko in catboost_ru
Но их всегда можно заенкодить самому :)
источник

MK

Maxim Khrisanfov in catboost_ru
это слишком примитивно) катбуст более продвинуто работает с ними
источник

A

Alexander in catboost_ru
ну тем не менее у меня было впечатление, что xgboost на сильно зашумленных данных давал прогнозы лучше lightgbm.
источник

A

Alexander in catboost_ru
и еще удивительно после xgboost, что обучение на gpu существенно быстрее идет, на xgboost я не видел разницы.
источник

MK

Maxim Khrisanfov in catboost_ru
Alexander
ну тем не менее у меня было впечатление, что xgboost на сильно зашумленных данных давал прогнозы лучше lightgbm.
никто тут думаю не скажет как оно работает, у всех данные разные, пробуйте катбсуст если не зайдет, то можно создать issue на гитхабе и прикрепить датасет)
источник
2019 August 12

VS

Vasily Suvorov in catboost_ru
Maxim Khrisanfov
вот тут человек пишет о проблеме https://github.com/catboost/catboost/issues/945 похожа на то я говорил неделю назад, начиная с 16.0 модель пишет в лог обучения одно, а когда применяешь ее показатели качества совсем другие
присоединяяюсь к этому вопросу, на голом датасете этого соревнования на версии 15.2 получал выше метрику чем после обновления на 16.2 и c новыми фичами, пока перешел на lgbm
источник

IP

Igor Petrov in catboost_ru
Vasily Suvorov
присоединяяюсь к этому вопросу, на голом датасете этого соревнования на версии 15.2 получал выше метрику чем после обновления на 16.2 и c новыми фичами, пока перешел на lgbm
У меня наоборот выросло
источник

AD

Anna Veronika Dorogush in catboost_ru
We've published CatBoost 0.16.3! The new release contains AUC Mu metric for multiclassification, get_confusion_matrix() method, time series cv and more: https://github.com/catboost/catboost/releases/tag/v0.16.3
источник

Bo

Blen obema in catboost_ru
Ребята, если имеется фича «месяц» и у нее 12 значений, то лучше катбусту скармливать ее как категориальная фича или как вещественная? И как быть в такой ситуации при использовании других алгоритмов: лес или xgboost например?
источник

P🐈

Pavel Tyavin 🐈 in catboost_ru
Blen obema
Ребята, если имеется фича «месяц» и у нее 12 значений, то лучше катбусту скармливать ее как категориальная фича или как вещественная? И как быть в такой ситуации при использовании других алгоритмов: лес или xgboost например?
предлагаю числовой. У значений фичи есть явный порядок
источник