Size: a a a

2019 August 11

Аa

Андрей amber4eg in catboost_ru
Blizhnikov Maxim
Ребят,а можно в catboost сказать модели,что на этих строках можно ошибаться ,а на этих нельзя, как-то взвесить каждую строку датасета?
Sample_weight или типа того посмотри в доке. Так не помню.
источник

BM

Blizhnikov Maxim in catboost_ru
Нашел этот параметр,но в документации не сказано,как его правильно устанавливать
источник

BM

Blizhnikov Maxim in catboost_ru
Как я понимаю ,чем больше вес ,тем меньше я хочу ,чтобы модель ошибалась на этом объекте
источник

Аa

Андрей amber4eg in catboost_ru
Вангую, что как list длиной n_samples или numpy array  ращмером (n_samples, ), где каждое число - вес примера
источник

Аa

Андрей amber4eg in catboost_ru
Как именно веса сработают - смотри раздел доки про метрики
источник

SK

Sergey Kolchenko in catboost_ru
Коллеги, а есть у кого прям эталонный и приятный код для связки катбуста + гридсерча\хуперопт? Не хочу писать еще один велосипед.
источник

A

Andrey in catboost_ru
Sergey Kolchenko
Коллеги, а есть у кого прям эталонный и приятный код для связки катбуста + гридсерча\хуперопт? Не хочу писать еще один велосипед.
У меня
источник

A

Andrey in catboost_ru
https://github.com/statist-bhfz/grideR Только он не идеальный, а какой получился
источник

SK

Sergey Kolchenko in catboost_ru
Ну да, он на Р
источник

SK

Sergey Kolchenko in catboost_ru
У меня просто весь пайплайн, включая фичи с сетки, на питоне
источник

A

Andrey in catboost_ru
в sklearn низзя катбуст тюнить? О_о
источник

A

Andrey in catboost_ru
в R есть нюанс с отсутствием катбуста и lightgbm на CRAN, поэтому в больших ML-пакетах готовых оберток нету. Отсюда велосипедостроение
источник

A

Andrey in catboost_ru
а на питоне в чем затык?
источник

SK

Sergey Kolchenko in catboost_ru
Да ни в чем, я написал уже, просто мало ли есть что нибудь интеересное - с еарли стопинг, валидацию смотреть на отдельном датасете а не по cv, вот это все
источник

A

Andrey in catboost_ru
>валидацию смотреть на отдельном датасете а не по cv

Holdout? Это частный случай cv
источник

A

Andrey in catboost_ru
бери 1 сплит из любой схемы кросс-валидации
источник

MK

Maxim Khrisanfov in catboost_ru
в катбуст 3-4 параметра, которые более менее влияют на качество, я их подбираю по очереди, у вас похоже бесконечные ресурсы и время раз вы гридсерч используете)
источник

SK

Sergey Kolchenko in catboost_ru
Maxim Khrisanfov
в катбуст 3-4 параметра, которые более менее влияют на качество, я их подбираю по очереди, у вас похоже бесконечные ресурсы и время раз вы гридсерч используете)
128 cpu
источник

MK

Maxim Khrisanfov in catboost_ru
@azkalot1 а почему, кстати, не GPU? на моих данных минимум в 10 раз быстрее
источник

SK

Sergey Kolchenko in catboost_ru
Maxim Khrisanfov
@azkalot1 а почему, кстати, не GPU? на моих данных минимум в 10 раз быстрее
Потому что на гпу в этот момент крутятся сетки :)
источник