Size: a a a

2018 December 30

OO

Oleg Okeev in catboost_ru
Maxim Khrisanfov
Ну если класс действительно редкий и нам нужны вероятности пусть они будут в диапазоне например 0.05-0.1, нам по сути так надо. Или CatBoost обязательно баланс нужен для нормальной работы?
У меня дисбаланс 24% на 76%
источник
2018 December 31

Аa

Андрей amber4eg in catboost_ru
Всех с наступающим!
Тем временем про Catboost вышла статейка на https://towardsdatascience.com/ad-demand-forecast-with-catboost-lightgbm-819e5073cd3e
источник

OO

Oleg Okeev in catboost_ru
Всех с праздником
источник

OO

Oleg Okeev in catboost_ru
Anna Veronika Dorogush
Сейчас не должен быть намного медленнее. От данных зависит, где-то медленнее, где-то быстрее. Это про цпу, на гпу должно быть всегда быстрее. Если это не так, скинь данные посмотреть.
А что значит кстати? На этапе сохранения модели при расчете через GPU, но файл сохраняется bin и json
Process finished with exit code -1073740791 (0xC0000409)
источник

OO

Oleg Okeev in catboost_ru
Это плохо?
источник
2019 January 01

MK

Maxim Khrisanfov in catboost_ru
Статья дичь, какие-то параметры модели там не реальные
источник

OT

Oscar Tempter in catboost_ru
Maxim Khrisanfov
Статья дичь, какие-то параметры модели там не реальные
Какая именно?
источник

MK

Maxim Khrisanfov in catboost_ru
Вот это
источник

MK

Maxim Khrisanfov in catboost_ru
А так да, С Новым Годом! :)
источник
2019 January 10

AB

Alexandr Bocharov in catboost_ru
Добрый день. Подскажите, если кто знает. Если есть несколько categorical features у которых значения только 0 или 1, то есть ли преимущество делать их numerical в каких либо ситуациях. Например, в случае неопределенности полагаться на border=0.5.
источник
2019 January 12

AD

Anna Veronika Dorogush in catboost_ru
Alexandr Bocharov
Добрый день. Подскажите, если кто знает. Если есть несколько categorical features у которых значения только 0 или 1, то есть ли преимущество делать их numerical в каких либо ситуациях. Например, в случае неопределенности полагаться на border=0.5.
По умолчанию кат фичи с 2 значениями обрабатываются при помощи one-hot encoding, поэтому будет тот же результат
источник
2019 January 18

DC

Danya Chepenko in catboost_ru
https://stackoverflow.com/questions/54171680/what-kind-of-preprocessing-was-used-to-encode-categorical-variables-in-catboost

Наткнулся на хороший вопрос. Можете объяснить?
источник

AD

Anna Veronika Dorogush in catboost_ru
Для всех считались счетчики - типа target-encoding, но по перестановке. Это лучшее, что можно сделать с катфичами, лучше, чем one-hot encoding, поэтому его и делали.
источник

AD

Anna Veronika Dorogush in catboost_ru
Подробности про подход есть в двух статьях
источник

AD

Anna Veronika Dorogush in catboost_ru
источник

DC

Danya Chepenko in catboost_ru
Спасибо, посмотрю!
источник
2019 January 22

OO

Oleg Okeev in catboost_ru
Anna Veronika Dorogush
Подробности про подход есть в двух статьях
Добрый день.
Что будет делать Catboost, если в колонке с предиктором иногда будет значение None
Выбросит всю колонку или все же обработает строки с None, и там где есть значение учтёт при прогнозе, а там где нет, не учтет?
источник

OO

Oleg Okeev in catboost_ru
В общем Стоит ли вручную обрабатывать все пропуски или Catboost их обработает?
источник

YB

Yury B in catboost_ru
На что влияет random seed?
источник

OT

Oscar Tempter in catboost_ru
Yury B
На что влияет random seed?
на все события в которых играет роль случайность, зафиксировав определенный random seed вы гарантируете одинаковую работу алгоритма везде где зафиксирован такой же random seed при прочих равных
источник