Телеграмм чат группы catboost

еще вопрос про кастомные метрики: заметил в примере реализации accuracy что вычисление идет итеративно через цикл, почему это не делается по "питоновски" когда используется numpy или просто через слайсы производятся операции ?

источник

14:01пожаловаться #9

Oscar Tempter in catboost_ru

источник

14:02пожаловаться #10

Anna Veronika Dorogu... in catboost_ru

это пример в документации же, его задача - показать, как лосс написать

источник

14:46пожаловаться #11

Anna Veronika Dorogu... in catboost_ru

но вообще кастомные метрики лучше писать в плюсах, будет работать намного быстрее

источник

14:52пожаловаться #12

Anna Veronika Dorogu... in catboost_ru

по тому, как это сделать, есть туториал в репозитории

источник

14:52пожаловаться #13

2020 May 02

Timur Nurlygayanov in catboost_ru

Всем привет, делаю бинарную классификацию с параметром Logloss, в обучаюшей выборке примеров одного класса значительно больше примеров второго класса (на пару порядков), и в результате обучения модель везде предсказывает только первый класс. Есть ли какие-то общие методы как готовить данные / указать какие-то параметры чтобы объекты второго класса тоже нормально детектились моделью? Кажется странным в обучающей выборке откидывать часть данных, относящихся к первому классу, но другого способа я пока не нашел.

источник

15:47пожаловаться #14

Мой любимый... in catboost_ru

самое унылое, что можно сделать - выкинуть большинство элементов с одного класса, что б было поровну)

источник

15:56пожаловаться #15

Мой любимый... in catboost_ru

гуглите imbalanced data

источник

15:56пожаловаться #16

Мой любимый... in catboost_ru

кстати, выкинуть почти весь датасет, это хоть и уныло, но рабочий вариант))

источник

15:57пожаловаться #17

Timur Nurlygayanov in catboost_ru

Спасибо )

источник

15:58пожаловаться #18

Aleksei Ustimenko in catboost_ru

Еще вариант поварьировать порог, у вас, скорее всего, класс 1 предсказывается, если модель выдала предсказание > 0.5, можно получить другие предсказания, если вы будете относить к первому классу по другому порогу

источник

16:27пожаловаться #19

Aleksei Ustimenko in catboost_ru

Подобрать порог можно по ошибке классификации на валидации

источник

16:29пожаловаться #20