Size: a a a

2018 September 27

AD

Anna Veronika Dorogush in catboost_ru
Это публичная группа, она создана для обсуждения вопросов, связанных с библиотекой CatBoost (https://catboost.ai). Задавайте вопросы, отвечайте на вопросы, делитесь ссылкой на группу! Группа предназначена для обсуждения на русском языке. Для обсуждений на английском языке просьба писать в группу https://t.me/catboost_en.
источник

AT

Anatoly Tomilov in catboost_ru
Привет. На stackoverflow на catboost таг никто не отвечает систематически
источник

AD

Anna Veronika Dorogush in catboost_ru
Мы стараемся следить, но не все успеваем. Иногда отвечаем не ответом, а комментом к сообщению, можно туда смотреть.
источник
2018 September 29

DT

Dmitry Torshin in catboost_ru
Это не вопрос по использованию. Но кто какие методы отбора признаков использует при отборе признаков? Кроме как поочередное исключение на кросс-валидации. Что я имею ввиду. В целом бустинг делает сплиты по всем признаком, да и выкидывать самые бесполезные по версии сплитов с точки зрения метрик не всегда хорошая идея.
Наверное проще для числовых/бинарных взять логрег и посмотреть на веса.
источник

VB

Valeriy Babushkin in catboost_ru
Это вопрос так вопрос , годами люди обсуждают
источник
2018 September 30

DT

Dmitry Torshin in catboost_ru
@VENHEADs надо же с чего-то начинать беседу
источник

В

Витя in catboost_ru
Визуализации классные
источник
2018 October 01

SF

Sergei Fironov in catboost_ru
Меня занимает вопрос что именно выводится в процессе обучения при заданном валидационном сете? это метрика посчитанная на каком-то случайном сабсемпле валидационного набора? Потому что метрика посчитанная на валидационном сете часто (далеко не всегда) отличается от того, что выводится в процессе обучения как лучшая.
источник

DT

Dmitry Torshin in catboost_ru
@Sergeif_239 выводится график разных метрик в зависимости от числа деревьев. Чтобы обрезать потом обученную модель(в том случае, если не стоит early_stop), то есть model.shrink(num_trees)
источник

SF

Sergei Fironov in catboost_ru
значение метрики для определенного числа деревьев отличается от метрики, посчитанной на валидационном сете при том же числе деревьев.
источник

SK

Stanislav Kirillov in catboost_ru
Sergei Fironov
значение метрики для определенного числа деревьев отличается от метрики, посчитанной на валидационном сете при том же числе деревьев.
У тебя в датасете есть катфичи?
источник

SF

Sergei Fironov in catboost_ru
Stanislav Kirillov
У тебя в датасете есть катфичи?
да
источник

DT

Dmitry Torshin in catboost_ru
@Sergeif_239 вроде бы такая проблема была у меня совсем давно, если в валидационном пуле указывать веса примеров
источник

SF

Sergei Fironov in catboost_ru
нет, весов нет. я бы пошарил ноутбук на каггле, но не знаю как это сделать, не привлекая внимания )
источник

SK

Stanislav Kirillov in catboost_ru
сейчас счетчики при обучении считаются и на тесте
источник

SK

Stanislav Kirillov in catboost_ru
я про ctr type ==counter
источник

DT

Dmitry Torshin in catboost_ru
@Sergeif_239 залей на гитлаб или битбакет и расшарь
источник

SK

Stanislav Kirillov in catboost_ru
чтоб все стало одинаковым, поставь counter_calc_method=SkipTest
источник

DT

Dmitry Torshin in catboost_ru
@kizill так вроде на итоговую модель процесс обучения никак не должен влять. разница лишь только в том, как делать сплиты.
источник

SF

Sergei Fironov in catboost_ru
Stanislav Kirillov
чтоб все стало одинаковым, поставь counter_calc_method=SkipTest
👍
источник