Телеграмм чат группы catboost

Коллеги. Есть сервер с двумя Intel(R) Xeon(R) Gold 5215 CPU @ 2.50GHz процами. Общим количеством ядер 40 штук и оперативки 512 гигов. Сервер в настоящий момент простаивает и могу его использовать для создания вашей модели. Заодно и само лучше пойму, как правильно работать с catboost. Желательно данные в формате Mysql, но можно и из файла подгрузить.

источник

22:08пожаловаться #8

pin in catboost_ru

Пишите в приват.

источник

22:08пожаловаться #9

2020 January 30

Andrei in catboost_ru

А почему у моделей КатБуста сигнатуры показывают что все параметры None?

источник

12:36пожаловаться #10

Anna Veronika Dorogush in catboost_ru

потому что дефолты зависят от проставленных опций и иногда от датасета

источник

12:37пожаловаться #11

Anna Veronika Dorogush in catboost_ru

для некоторых опций

источник

12:38пожаловаться #12

Anna Veronika Dorogush in catboost_ru

ну и выставляются все дефолты в одном месте, общем для питона, R и cmdline

источник

12:38пожаловаться #13

Anna Veronika Dorogush in catboost_ru

еще одна причина - если все дефолты указать, то когда пользователь будет вызывать get_params, он получит миллион опций вместо своих проставленных

источник

12:39пожаловаться #14

Andrei in catboost_ru

Anna Veronika Dorogush

потому что дефолты зависят от проставленных опций и иногда от датасета

а в какой момент это происходит?

источник

12:46пожаловаться #15

Anna Veronika Dorogush in catboost_ru

перед запуском обучения в плюсовом коде

источник

12:48пожаловаться #16

2020 January 31

Sergey Shalnov in catboost_ru

Можно ли отслеживать метрики ранжирования в качестве evaluation_metric если тренирую модель как бинарную классификацию? Или может как-то можно прокинуть group_id в свою самописную метрику?

Есть 1000 запросов в каждом по 100 документов. Есть разметка 1 - релевантен, 0 - не релевантен. Хочется максимизировать среднюю NDCG по запросам. Пока самый оптимальный способ который заработал - тренировать как обычную бинарную классификацию с loss_function='Logloss'. Но здесь есть проблема - не понятно когда начинаем переобучаться, хотелось бы видеть NDCG на валидационной выборке.

Пытался тренировать как ранжирование - результат хуже.

источник

16:28пожаловаться #17

Anna Veronika Dorogush in catboost_ru

можно отслеживать, да

источник

16:30пожаловаться #18

Anna Veronika Dorogush in catboost_ru

просто поставить ее в поле eval_metric или custom_metrics

источник

16:30пожаловаться #19

Anna Veronika Dorogush in catboost_ru

только в пуле обучающем и тестовом надо колонку group_id добавить, чтобы считалось по группам

источник

16:30пожаловаться #20