Size: a a a

2019 April 17

OT

Oscar Tempter in catboost_ru
Как будто не подаешь целевую переменную с таргетом
источник

SZ

Sasha Zhu in catboost_ru
источник

SZ

Sasha Zhu in catboost_ru
А что тут является целевой переменной?
источник

SZ

Sasha Zhu in catboost_ru
labels?
источник

AD

Anna Veronika Dorogush in catboost_ru
Igor Petrov
CV зависает(ячейка в ноутбуке стоит уже два часа и ни чего) при разбиении 20+ фолдов из 2М строк.
Как-то можно это вылечить?
Она не зависает, просто считается батчами. Действительно не очень хорошее логгирование получилось в этом случае, мы поправим, вот issue https://github.com/catboost/catboost/issues/664
источник

IP

Igor Petrov in catboost_ru
Anna Veronika Dorogush
Она не зависает, просто считается батчами. Действительно не очень хорошее логгирование получилось в этом случае, мы поправим, вот issue https://github.com/catboost/catboost/issues/664
Спасибо
источник
2019 April 18

P

Polosataya in catboost_ru
здравствуйте. Пробую ранжирование приспособить для рекомендаций. label  - это известные рейтинги фильмов от каждого пользователя,  group_id - id пользователя. А id фильма - это индекс, или надо псевдоиндекс сделать? Или это делается по другому?
источник

YS

Yaroslav Sviridov in catboost_ru
Добрый вечер!
Подскажите пожалуйста есть ли в cat встроенный функционал для перебора используемых фичей? Хочу перебрать все 2^n вариантов наборов фичей, ибо у меня их не так много. Поставить на них cv и посмотреть самую результативную выборку фичей.
источник

V

Viktor in catboost_ru
вот это посмотрите
источник

AD

Anna Veronika Dorogush in catboost_ru
Yaroslav Sviridov
Добрый вечер!
Подскажите пожалуйста есть ли в cat встроенный функционал для перебора используемых фичей? Хочу перебрать все 2^n вариантов наборов фичей, ибо у меня их не так много. Поставить на них cv и посмотреть самую результативную выборку фичей.
Можно запустить грид серч с параметром ignored_features, в котором будут перечислены все 2^n вариантов.
источник

SZ

Sasha Zhu in catboost_ru
Всем привет! Решаю регрессионную задачу, много катфич — использую поэтому Catboost. Но что-то результат меня совсем не радует.
Фичеинжиниринг был, думаю попробовать гридсерчем пройтись, но в чем закавыка: если тот же xgb можно стакать с другими алгоритмами, с катбустом не видела ничего. Есть какие-то варианты для улучшения перформанса модели с большим количеством катфич?
Или может в сторону нейронок идти?
Но бустинг вроде лучше с таким справляется...
источник

YS

Yaroslav Sviridov in catboost_ru
Anna Veronika Dorogush
Можно запустить грид серч с параметром ignored_features, в котором будут перечислены все 2^n вариантов.
Grid search из sklearn?
источник

AD

Anna Veronika Dorogush in catboost_ru
да
источник

YS

Yaroslav Sviridov in catboost_ru
Спасибо :)
источник

AD

Anna Veronika Dorogush in catboost_ru
> много катфич — использую поэтому Catboost
да катбуст не для катфичей
источник

AD

Anna Veronika Dorogush in catboost_ru
А для любых табличных данных. Которые в том числе могут содержать катфичи, но это минорная часть использования библиотеки.
источник

SZ

Sasha Zhu in catboost_ru
Окей, спасибо
источник

AD

Anna Veronika Dorogush in catboost_ru
а в чем со стекингом проблема?
источник

AD

Anna Veronika Dorogush in catboost_ru
Для регрессии с катфичами можно попробовать увеличить бинаризацию таргета. По умолчанию для регрессии считаются счетчики как для бинкласса, только успехом считается, если таргет больше медианы.
источник

SZ

Sasha Zhu in catboost_ru
Anna Veronika Dorogush
Для регрессии с катфичами можно попробовать увеличить бинаризацию таргета. По умолчанию для регрессии считаются счетчики как для бинкласса, только успехом считается, если таргет больше медианы.
О, спасибо!
источник