Size: a a a

2019 March 06

SK

Stanislav Kirillov in catboost_ru
это можно проверить, сконструировав catboost.Pool из этого dataframe
источник

IF

Ivan Filonov in catboost_ru
на глаз минут 5-7 на 7820
источник

IF

Ivan Filonov in catboost_ru
позже могу замерить чисто создание пула, но это явно не час с лишним, после которого я перед этим начал спрашивать
источник

SK

Stanislav Kirillov in catboost_ru
Это не обязательно, спасибо большое за твое участие:)
источник
2019 March 08

SZ

Sasha Zhu in catboost_ru
Привет, подскажите, что означает ошибка?
источник

SZ

Sasha Zhu in catboost_ru
_catboost.CatboostError: util/stream/input.cpp:77: Failed to read required number of bytes from stream! Expected: 782063312, gained: 413728760!
источник

SK

Stanislav Kirillov in catboost_ru
Это загрузка модели?
источник
2019 March 09

DL

Dmitri Lihhatsov in catboost_ru
Подскажите, пожалуйста, есть ли разница в том, как сохранять модель на диск: через `save_model` или просто с помощью `pickle`?
источник

AK

Andrei Khropov in catboost_ru
save_model может сохранять в бОльшее число форматов модели, чем pickle, который python-specific.
источник

AK

Andrei Khropov in catboost_ru
Еще pickle сохраняет дополнительные атрибуты класса CatBoost* в отличие от save/load_model.
источник
2019 March 10

FF

Frank F in catboost_ru
Stanislav Kirillov
заведи issue, пожалуйста, чтобы мы не забыли
Привет.
У меня есть 4 значения logloss
1. Выборка - train
2.Выборка - test
3. Cv - train
4.Cv - test
Первые две понятно, что мы обучили Модель и проверили на тесте качество
А 3 и 4 мы просто разбиваем Модель x-раз на train/test и каждый раз заново учим ее и проверяем на тесте для определения стабильности модели, но сами результаты x Новых обучившихся моделей не используем ?
То есть, если все ок, используем параметры той первой модели ?
источник

PC

Pika Chu in catboost_ru
Стабильность модели это другое. Кросс-валидация нужна, чтобы получить оптимальну оценку точности модели с точки зрения смещения и дисперсии. Если оценка получаения на CV устраивает, то для production-использования можно обучиться вообще на всей выборке, не разбивая на train и test.
источник

FF

Frank F in catboost_ru
Pika Chu
Стабильность модели это другое. Кросс-валидация нужна, чтобы получить оптимальну оценку точности модели с точки зрения смещения и дисперсии. Если оценка получаения на CV устраивает, то для production-использования можно обучиться вообще на всей выборке, не разбивая на train и test.
То есть просто смотрим не ухудшилось ли качество на кросс-валидации и есть кардинального падения не случилось, то смело используем параметры исходной модели ?
источник

PC

Pika Chu in catboost_ru
Frank F
То есть просто смотрим не ухудшилось ли качество на кросс-валидации и есть кардинального падения не случилось, то смело используем параметры исходной модели ?
Нет. Просто выбираешь как-нибудь модель, если результаты кросс-валидации устраивают.
источник

PC

Pika Chu in catboost_ru
Вообще, заморачиваться нужно, если выборка маленькая.
источник

FF

Frank F in catboost_ru
Pika Chu
Нет. Просто выбираешь как-нибудь модель, если результаты кросс-валидации устраивают.
Из чего выбирать? У меня есть обученная на трейне Модель , которая на тесте хорошо себя показала, и потом на кроссвалидации на 5 фолдах также все хорошо
источник

FF

Frank F in catboost_ru
Я думал ее и оставлять нужно
источник

PC

Pika Chu in catboost_ru
Можешь взять её, а можешь другую, которая имеет большое качество, например
источник

MK

Maxim Khrisanfov in catboost_ru
на logloss по train я бы тоже смотрел
источник
2019 March 11

FF

Frank F in catboost_ru
Pika Chu
Можешь взять её, а можешь другую, которая имеет большое качество, например
А что разве можно сохранять модели из кросс-валидации ?
источник