Size: a a a

2019 December 06

A

Alex.Ash in catboost_ru
День добрый. Вопрос по поводу мультиклассификации. 4 класса. На выходе получаю вероятности. У 20% тестового сета ни одна из 4-ёх вероятностей не превышает 50%, к примеру (0.277072 0.338988 0.359013 0.024927). Как с этим бороться? Кроме того, чтобы играться с весами в гиперпараметре class_weights?
источник

Аa

Андрей amber4eg in catboost_ru
Классы в реальности человеком разделимы? Вот в этом конкретном примере человек может уверенно сказать "ну конечно, это 2й класс, а не 3й!"?
источник

Аa

Андрей amber4eg in catboost_ru
Если да, то обосновать может?
Если да, то аргументы для обоснования есть в признаках модели?
источник

A

Alex.Ash in catboost_ru
в моём случае да) модель определения уровня зарплаты людей. Но з.п. разделена на классы, а не регрессия.
источник

A

Alex.Ash in catboost_ru
Идеально разделяющих фичей нет. Но если я строю 4-е бинарные модельки, то, естественно, у меня получается лишь 5% тех, у кого предельный скор меньше 50%... Вот и думаю, как бы построить мультикласс, но чтобы как у бинарки были максимальные вероятности
источник

Аa

Андрей amber4eg in catboost_ru
Выглядит так, будто у части людей есть необоснованно высокие или низкие зарплаты, раз нет признаков, которые могли бы эти зарплаты определить.
источник

Аa

Андрей amber4eg in catboost_ru
А почему не регрессия, кстати?
источник

A

Alex.Ash in catboost_ru
Андрей amber4eg
А почему не регрессия, кстати?
Нет чистого таргета, таргет как раз по классам удалось собрать
источник

A

Alex.Ash in catboost_ru
Андрей amber4eg
Выглядит так, будто у части людей есть необоснованно высокие или низкие зарплаты, раз нет признаков, которые могли бы эти зарплаты определить.
Ну, тут проблема больше технического характера... Надо как-то изменить вероятности, чтобы стало как у бинарки... По суть реколы/пресижены у мультикласса такие же, как у объединённых бинарок. Значит, нужно просто трансформировать вероятности мультикласса, без потери качества...
источник

A

Alex.Ash in catboost_ru
Alex.Ash
Идеально разделяющих фичей нет. Но если я строю 4-е бинарные модельки, то, естественно, у меня получается лишь 5% тех, у кого предельный скор меньше 50%... Вот и думаю, как бы построить мультикласс, но чтобы как у бинарки были максимальные вероятности
вопрос снимается. Как я понял, catboost выдаёт сразу откалиброванные вероятности в мультиклассе. Если бинарки калибровать, то выходит примерно тоже, что и в catboost. Даже похуже
источник

N

Norx in catboost_ru
Deep Double Descent

https://openai.com/blog/deep-double-descent/

Deep Double Descent: Where Bigger Models and More Data Hurt

https://arxiv.org/abs/1912.02292
источник
2019 December 07

ВК

Вячеслав Колосков in catboost_ru
Всем привет.
А можно как-нибудь сделать так, чтобы графики, которые нарисовал катбуст после переоткрытия блокнота нормально отображались?
источник

P🐈

Pavel Tyavin 🐈 in catboost_ru
Вячеслав Колосков
Всем привет.
А можно как-нибудь сделать так, чтобы графики, которые нарисовал катбуст после переоткрытия блокнота нормально отображались?
Можно сохранить в файл. А что с твоими графиками не так ?
источник

ВК

Вячеслав Колосков in catboost_ru
они просто не отображаются
источник

ВК

Вячеслав Колосков in catboost_ru
после переоткрытия ноутбука
источник

ВК

Вячеслав Колосков in catboost_ru
сиборн например отображается
источник

ВК

Вячеслав Колосков in catboost_ru
вот хотелось бы так же :)
источник

b

bulat in catboost_ru
+1
источник
2019 December 08

A

Alex.Ash in catboost_ru
Вячеслав Колосков
после переоткрытия ноутбука
init_notebook_mode(connected=True)
источник

LB

Lexi Bender in catboost_ru
Привет! Вопрос — как можно делать eval по f1 скору, но с моим собственным значением порога?
источник