Size: a a a

2018 November 29

ND

Nikita Dmitriev in catboost_ru
Да, убрали. Теперь это можно настроить с помощью параметров --simple-ctr и --combinations-ctr
https://tech.yandex.com/catboost/doc/dg/concepts/cli-reference_train-model-docpage/#cli-reference_train-model
источник

OT

Oscar Tempter in catboost_ru
может кто-то подскажет: в катбусте есть очень крутой параметр use_best_model, но этой функцией не получится воспользоваться если делать оптимизацию гиперпараметров с помощью sklearn.model_selection.GridSearchCV потому-что этот метод, насколько я понял, не имеет возможности подавать валидационный сет в модель, а значит невозможно посчитать метрику для оценки переобучения. Какой наилучший способ настройки гиперпараметров у катбуста? Только вручную написать перебор по сетке или есть готовые реализации?
источник

OT

Oscar Tempter in catboost_ru
просто если делать перебор параметров по сетке, чтобы подобрать оптимальный вариант с числом деревьев на это уйдет слишком много времени на обучение, с использованием GridSearchCV
источник

DL

Dmitri Lihhatsov in catboost_ru
Oscar Tempter
может кто-то подскажет: в катбусте есть очень крутой параметр use_best_model, но этой функцией не получится воспользоваться если делать оптимизацию гиперпараметров с помощью sklearn.model_selection.GridSearchCV потому-что этот метод, насколько я понял, не имеет возможности подавать валидационный сет в модель, а значит невозможно посчитать метрику для оценки переобучения. Какой наилучший способ настройки гиперпараметров у катбуста? Только вручную написать перебор по сетке или есть готовые реализации?
А hyperopt для этих целей использовать не пробовали? На сколько я знаю, с ним можно использовать Catboost напрямую, как есть, и подавать валидацию.
источник

OT

Oscar Tempter in catboost_ru
нет не пробовал, это в какой библиотеке?
источник

OT

Oscar Tempter in catboost_ru
а это и есть библиотека
источник

DL

Dmitri Lihhatsov in catboost_ru
Oscar Tempter
а это и есть библиотека
да, https://github.com/hyperopt/hyperopt, он реализует random grid search, по аналогии с sklearn.model_selection.RandomizedSearchCV
источник

OT

Oscar Tempter in catboost_ru
спасибо, буду пробовать
источник
2018 December 01

В

Витя in catboost_ru
Привет, а будет возможность смотреть feature importance по gain а не по weight?
источник
2018 December 05

ND

Nikita Dmitriev in catboost_ru
Витя
Привет, а будет возможность смотреть feature importance по gain а не по weight?
Привет!
А можешь сказать, что ты подразумеваешь под gain и weight?
источник

В

Витя in catboost_ru
Nikita Dmitriev
Привет!
А можешь сказать, что ты подразумеваешь под gain и weight?
Если я правильно понимаю, то weight характеризует то, как часто идет разбиение в дереве по признаку, а gain - по наибольшему изменению энтропии
источник

В

Витя in catboost_ru
В xgboost есть такое
источник

ND

Nikita Dmitriev in catboost_ru
У нас сейчас feature importance для фичи означает насколько сильно меняются значения в листьях, если ты инвертируешь все сплиты во всех деревьях по данной фиче. Подробнее можно почитать вот тут https://tech.yandex.com/catboost/doc/dg/concepts/fstr-docpage/ в разделе FeatureImportance в Calculation principles.
То есть это не просто “weight”, но и не “gain”.
А чем тебе наш feature importance не нравится?) Или просто хочется и через gain считать?
Вообще пока не планировали добавлять, но всегда можно законтрибьютить)
источник

В

Витя in catboost_ru
Мне все нравится, просто для моей задачи нужен был gain)
источник

В

Витя in catboost_ru
Nikita Dmitriev
У нас сейчас feature importance для фичи означает насколько сильно меняются значения в листьях, если ты инвертируешь все сплиты во всех деревьях по данной фиче. Подробнее можно почитать вот тут https://tech.yandex.com/catboost/doc/dg/concepts/fstr-docpage/ в разделе FeatureImportance в Calculation principles.
То есть это не просто “weight”, но и не “gain”.
А чем тебе наш feature importance не нравится?) Или просто хочется и через gain считать?
Вообще пока не планировали добавлять, но всегда можно законтрибьютить)
Почитаю)
источник

В

Витя in catboost_ru
Спасибо за ответ
источник
2018 December 07

A

Alexander Moiseev in catboost_ru
Всем привет! А я правильно понял, что на macbook pro 2108 15 с отдельным GPU чипом можно натсроить его использование catboost-ом слудуя гайду на сайте?
источник
2018 December 08

VE

Vasily Ershov in catboost_ru
Alexander Moiseev
Всем привет! А я правильно понял, что на macbook pro 2108 15 с отдельным GPU чипом можно натсроить его использование catboost-ом слудуя гайду на сайте?
привет, если со встроенным в макбук GPU (там AMD), то нельзя
если с внешним NVIDIA, подключенным через tunderbolt/usb type-c, то можно
источник

DC

Danya Chepenko in catboost_ru
а как катбуст работает с continious признаками? Помню, что есть биниги, а есть внутри интсрументы по уменьшению размерности? Или лучше эту операцию делать до обучения?
источник
2018 December 11

DL

Dmitri Lihhatsov in catboost_ru
Danya Chepenko
а как катбуст работает с continious признаками? Помню, что есть биниги, а есть внутри интсрументы по уменьшению размерности? Или лучше эту операцию делать до обучения?
ну есть же в документации параметр max_bin, он же border_count
источник