Size: a a a

2019 May 26

Bo

Blen obema in catboost_ru
Если вдруг путаешься, то руководствуйся этой таблицей)
источник

Д

Дмитрий in catboost_ru
Спасибо большое))
Получается на предикт смотрим, теперь понял
источник

Д

Дмитрий in catboost_ru
Хорошо!)
источник

Bo

Blen obema in catboost_ru
Всегда пожалуйста)
источник

A

Aнтон in catboost_ru
Коллеги, вопрос на тему "дообучения" уже имеющейся модели - если взять модель М1 обученную на признаках Х1, и дообучить её добавив в тот же датасет признаки Х2 и получив модель М2, то может ли эта модель М2 быть измеримо хуже, чем модель, которая изначально строилась на обоих наборах признаков Х1+Х2 ?
источник

A

Aнтон in catboost_ru
При прочих равных
источник

A

Aнтон in catboost_ru
Или скорее "обученная за то же время"
источник

A

Aнтон in catboost_ru
В контексте catboost это Pool(..., baseline=train_baseline)
источник

A

Aнтон in catboost_ru
Или скорее параметр snapshot_file в методе fit
источник

A

Aнтон in catboost_ru
Наверное вопрос можно перефразировать - можно ли на первой итерации так испортить модель (уйти в локальной максимум), что на второй её уже не исправишь до того же приблизительно того же качества, которое могло бы быть изначально (т.е. не вытянешь ближе к глобальному максимуму, за тот же отрезок времени)
источник

A

Aнтон in catboost_ru
И на самом деле вопрос скорее про "как у вас на практике обычно выходит", потому что в теории и так понятно, что можно искуственно такие данные подобрать в Х1, что первая модель уедет куда-то далеко от оптимума
источник

Bo

Blen obema in catboost_ru
А есть смысл нормализовать данные перед подачей их в катбуст?
источник

K

K-S in catboost_ru
Blen obema
А есть смысл нормализовать данные перед подачей их в катбуст?
Деревьям нормализация не нужна
источник

Bo

Blen obema in catboost_ru
Спасибо
источник

SK

Stanislav Kirillov in catboost_ru
Blen obema
А есть смысл нормализовать данные перед подачей их в катбуст?
https://catboost.ai/docs/concepts/binarization.html#binarization - для флоатных фичей применяется квантизация, можно тут посмотреть какие способы построения границ есть
источник

Bo

Blen obema in catboost_ru
Благодарю!
источник

Bo

Blen obema in catboost_ru
Кстати, а не планируется разработка ещё какой-то открытой библиотеки для ML от яндекс? Может нейронки, кластеризация и тд?
источник
2019 May 27

AD

Anna Veronika Dorogush in catboost_ru
Welcome @carol, our 300-th participant! 😊
источник

AD

Anna Veronika Dorogush in catboost_ru
Мы тут на русском говорим, я запуталась в группах. Да, нас теперь 300!
источник

AS

Alexsey Shestacov in catboost_ru
источник