Size: a a a

2019 May 04

SK

Stanislav Kirillov in catboost_ru
Нужно только learning rate указать явно, иначе подсчитается для 400 деревьев другой
источник

Bo

Blen obema in catboost_ru
Андрей amber4eg
можно обучить заново на 400 деревьев
Берем дефолтную модель, которая обучается 1000 итераций. Она находит оптимальную итерацию по валидационной выборке (допустим 351 дерево). Потом я ставлю n_estimators = 400, чтоб не так долго обучаться и получить тот же результат на 351м дереве. А результат получается другой. Но тут товарищ админ написал, что learning rate зависит от кол-ва деревьев и поэтому, как я догадываюсь, у менч и получается другой результат. Надо будет считать рейт с 1000 и явно указать такой же для модели с n_estimators=400
источник

Bo

Blen obema in catboost_ru
Я как раз ломал над этим голову
источник

Аa

Андрей amber4eg in catboost_ru
Stanislav Kirillov
Нужно только learning rate указать явно, иначе подсчитается для 400 деревьев другой
внезапно! Я думал, что всегда lr=0.03
источник

SK

Stanislav Kirillov in catboost_ru
не, есть специально подобранная формула
источник

SK

Stanislav Kirillov in catboost_ru
источник
2019 May 06

P🐈

Pavel Tyavin 🐈 in catboost_ru
Сходил вчера на pycon.it . Все датасаентисты, с которыми я общался, знают, что такое catboost
источник

P🐈

Pavel Tyavin 🐈 in catboost_ru
Из преимуществ заявляют два:
1) Быстрый.
2) Когда не понятно, что делать с датасетом - нужно просто использовать catboost и не думать.
источник

DD

Dmitry Donchenko in catboost_ru
Pavel Tyavin 🐈
Из преимуществ заявляют два:
1) Быстрый.
2) Когда не понятно, что делать с датасетом - нужно просто использовать catboost и не думать.
Быстрый относительно чего? У xgboost вроде действительно выигрывает немного, но lightgbm быстрее
источник

A

Andrey in catboost_ru
Pavel Tyavin 🐈
Из преимуществ заявляют два:
1) Быстрый.
2) Когда не понятно, что делать с датасетом - нужно просто использовать catboost и не думать.
>датасаентисты
>не думать
Датасаенс как он есть
источник

K

K-S in catboost_ru
Andrey
>датасаентисты
>не думать
Датасаенс как он есть
👍🏻
источник

SK

Stanislav Kirillov in catboost_ru
У нас самый быстрый gpu 😎
источник

K

K-S in catboost_ru
Как оказалось, даже в такой ботве как последний сантандер своими размышлениями можно было прийти к более высокому скору.

А уж в реальной практике ситуации "непонятно, что делать с датасетом" вообще по идее не должно возникать.
источник

SK

Sergey Kolchenko in catboost_ru
Ну фиг знает,  Lightgbm у меня в 20 раз быстрей чём катбуст
источник

Аa

Андрей amber4eg in catboost_ru
Sergey Kolchenko
Ну фиг знает,  Lightgbm у меня в 20 раз быстрей чём катбуст
это на обучении. А на прогнозе с большим количеством деревьев?
источник

SK

Sergey Kolchenko in catboost_ru
С такой скоростью я до прогноза не дойду :)))
источник

SK

Stanislav Kirillov in catboost_ru
Sergey Kolchenko
Ну фиг знает,  Lightgbm у меня в 20 раз быстрей чём катбуст
Катфичи?
источник

SK

Stanislav Kirillov in catboost_ru
GPU?
источник

VE

Vasily Ershov in catboost_ru
Sergey Kolchenko
Ну фиг знает,  Lightgbm у меня в 20 раз быстрей чём катбуст
а можно подбронее: что обучается и с какими параметрами?
источник

SK

Sergey Kolchenko in catboost_ru
Vasily Ershov
а можно подбронее: что обучается и с какими параметрами?
Данные с соревнования crowdanalytix (mortgage,  бинарная классификация)
источник