Size: a a a

2019 June 10

Д

Дмитрий in catboost_ru
А в PNG можно сохранить? Out_file нет параметра
источник

P🐈

Pavel Tyavin 🐈 in catboost_ru
Дмитрий
А в PNG можно сохранить? Out_file нет параметра
Можно. Гуглите в сторону graphviz
источник

Д

Дмитрий in catboost_ru
Так он через dot файл
источник

P🐈

Pavel Tyavin 🐈 in catboost_ru
Иван Брагин
отсортировать по ней можно или groupby сделать а потом раскрыть. В общем не должно быть между двумя значениями одной группы значение другой группы
А зачем вообще эта сортировка нужна? Разве кэтбуст не засовывает всё в память у себя?
источник

ИБ

Иван Брагин in catboost_ru
Pavel Tyavin 🐈
А зачем вообще эта сортировка нужна? Разве кэтбуст не засовывает всё в память у себя?
не знаю, без сортировки  ошибку выдает (на 0.13) да и в документации так было. Может сейчас не требуется
источник

AD

Anna Veronika Dorogush in catboost_ru
Сортировку мы могли бы сами делать, но это safety check, часто так ошибки находятся, типа разные группы с одним id
источник
2019 June 12

Д

Дмитрий in catboost_ru
Всем привет, подскажите, пожалуйста, CatBoost строит деревья решений параллельно или нет?
источник

VE

Vasily Ershov in catboost_ru
Каждое дерево подбирается параллельно, итерации бустинга последовательно
источник

Д

Дмитрий in catboost_ru
То есть каждый раз заново собираются случаи, где есть ошибки?
источник

AD

Anna Veronika Dorogush in catboost_ru
На каждой итерации заново пересчитываются градиенты
источник

Д

Дмитрий in catboost_ru
Так
источник

Д

Дмитрий in catboost_ru
источник

Д

Дмитрий in catboost_ru
Получается, что эта картинка актуальна для XGBoost только?
источник

VE

Vasily Ershov in catboost_ru
Дмитрий
Получается, что эта картинка актуальна для XGBoost только?
Бустинг так не работает, это очень упрощенное объяснение
источник

VE

Vasily Ershov in catboost_ru
Всегда используются все примеры (если нету бутстрапа), просто деревья подбираются так, чтобы следующее исправляло ошибки предыдущих
источник

Д

Дмитрий in catboost_ru
Теперь понял, но как тогда они подбираются параллельно, если нужны детерминированные данные для каждого следующего дерева
источник

AD

Anna Veronika Dorogush in catboost_ru
деревья подбираются последовательно
источник

VE

Vasily Ershov in catboost_ru
А вот подбор самого дерево параллелиться по данным (большое число вычислениц можно делать в много потоков)
источник

AS

Andrey Stroganov in catboost_ru
Есть ли какой-нибудь способ обрезать немного готовую модель? Я запустил обучение на 10тыщ деревьев, и вижу что после 3000 есть уже улучшения теста, но они в пятом знаке. А файл модели огромный, я бы его хвост раза в три сократил бы с удовольствием.
источник

AD

Anna Veronika Dorogush in catboost_ru
model.shrink in python
источник