Size: a a a

2020 January 29

AK

Andrei Khropov in catboost_ru
пока в широких пределах - да
источник

SK

Stanislav Kirillov in catboost_ru
Можно ожидать, что любая старая модель обязана работать на более новой версии библиотеки
источник

AD

Anna Veronika Dorogush in catboost_ru
ну не каждая с каждой, модель меняется, в нее что-то добавляется. Но обратную совместимость мы не ломаем
источник

Аa

Андрей amber4eg in catboost_ru
в несвежих версиях java есть проблема - оно падает, если в модели есть признаки с feature importance = 0. На самой свежей такого нет.
источник

AK

Andrei Khropov in catboost_ru
но в будущем будут изменения так что модели обученные новой версий trainer будут требовать и новой версии applier.
источник

AK

Andrei Khropov in catboost_ru
Совместимость старых моделей с новыми версиями applier планируется сохранять
источник

AM

Aleksandr Mikhailov in catboost_ru
всем спасибо за информацию
источник

p

pin in catboost_ru
Коллеги. Есть сервер с двумя Intel(R) Xeon(R) Gold 5215 CPU @ 2.50GHz процами.  Общим количеством ядер 40 штук и оперативки 512 гигов. Сервер в настоящий момент простаивает и могу его использовать для создания вашей модели. Заодно и само лучше пойму, как правильно работать с catboost. Желательно данные в формате Mysql, но можно и из файла подгрузить.
источник

p

pin in catboost_ru
Пишите в приват.
источник
2020 January 30

A

Andrei in catboost_ru
А почему у моделей КатБуста сигнатуры показывают что все параметры None?
источник

AD

Anna Veronika Dorogush in catboost_ru
потому что дефолты зависят от проставленных опций и иногда от датасета
источник

AD

Anna Veronika Dorogush in catboost_ru
для некоторых опций
источник

AD

Anna Veronika Dorogush in catboost_ru
ну и выставляются все дефолты в одном месте, общем для питона, R и cmdline
источник

AD

Anna Veronika Dorogush in catboost_ru
еще одна причина - если все дефолты указать, то когда пользователь будет вызывать get_params, он получит миллион опций вместо своих проставленных
источник

A

Andrei in catboost_ru
Anna Veronika Dorogush
потому что дефолты зависят от проставленных опций и иногда от датасета
а в какой момент это происходит?
источник

AD

Anna Veronika Dorogush in catboost_ru
перед запуском обучения в плюсовом коде
источник
2020 January 31

SS

Sergey Shalnov in catboost_ru
Можно ли отслеживать метрики ранжирования в качестве evaluation_metric если тренирую модель как бинарную классификацию? Или может как-то можно прокинуть group_id в свою самописную метрику?

Есть 1000 запросов в каждом по 100 документов. Есть разметка 1 - релевантен, 0 - не релевантен. Хочется максимизировать среднюю NDCG по запросам. Пока самый оптимальный способ который заработал - тренировать как обычную бинарную классификацию с loss_function='Logloss'. Но здесь есть проблема - не понятно когда начинаем переобучаться, хотелось бы видеть NDCG на валидационной выборке.

Пытался тренировать как ранжирование - результат хуже.
источник

AD

Anna Veronika Dorogush in catboost_ru
можно отслеживать, да
источник

AD

Anna Veronika Dorogush in catboost_ru
просто поставить ее в поле eval_metric или custom_metrics
источник

AD

Anna Veronika Dorogush in catboost_ru
только в пуле обучающем и тестовом надо колонку group_id добавить, чтобы считалось по группам
источник