Size: a a a

2019 May 12

Д

Дмитрий in catboost_ru
Всем привет.
Кстати, может кто сказать, можем ли мы менять сами важность признаков в методе?

И тоже самое про порог принятия признака. По умолчанию он 0,5. То есть поставить 0,7, например, чтобы в задаче бинарной классификации 0,5 было отнесено к 0, а не к 1. (threshold)
Спасибо!
источник

Д

Дмитрий in catboost_ru
источник

Bo

Blen obema in catboost_ru
Можно точно получить сырые вероятности, а дальше уже самому доделать порог через условие. Ну это как вариант. Возможно изменение порога предусмотрено и в самом классификаторе. Нужно смотреть документацию
источник

Bo

Blen obema in catboost_ru
Всем привет.
Кстати, может кто сказать, можем ли мы менять сами важность признаков в методе?

И тоже самое про порог принятия признака. По умолчанию он 0,5. То есть поставить 0,7, например, чтобы в задаче бинарной классификации 0,5 было отнесено к 0, а не к 1. (threshold)
Спасибо!
источник

Д

Дмитрий in catboost_ru
Понял, посмотрю! Спасибо
источник

Д

Дмитрий in catboost_ru
Можно точно получить сырые вероятности, а дальше уже самому доделать порог через условие. Ну это как вариант. Возможно изменение порога предусмотрено и в самом классификаторе. Нужно смотреть документацию
источник

Д

Дмитрий in catboost_ru
Может кто уже сталкивался просто
источник

S

Sunsh1ne in catboost_ru
Всем привет.
Подскажите, пожалуйста, можно ли у уже обученной модели (бинарная классификация) узнать самый вероятный категориальный фактор, если все остальные факторы известны. То есть по сути известно все факторы и даже к какому классу относится пример, но не известен один из факторов.
спасибо
источник

A

Aleksei in catboost_ru
Sunsh1ne
Всем привет.
Подскажите, пожалуйста, можно ли у уже обученной модели (бинарная классификация) узнать самый вероятный категориальный фактор, если все остальные факторы известны. То есть по сути известно все факторы и даже к какому классу относится пример, но не известен один из факторов.
спасибо
Прогони все возможные значения категории и выбери то, у которой предикт ближе всего к таргету, например
источник

S

Sunsh1ne in catboost_ru
Aleksei
Прогони все возможные значения категории и выбери то, у которой предикт ближе всего к таргету, например
Как вариант, но но этот признак может быть содержать сотни тысяч вариантов, поэтому как-то неоптимальненько
источник

A

Aleksei in catboost_ru
Категориальный признак с сотней тысяч вариантов уже звучит неоптимальненько
источник

A

Aleksei in catboost_ru
Btw я золотой пули тут не знаю, мб кто ещё поможет)
источник

Bo

Blen obema in catboost_ru
Sunsh1ne
Всем привет.
Подскажите, пожалуйста, можно ли у уже обученной модели (бинарная классификация) узнать самый вероятный категориальный фактор, если все остальные факторы известны. То есть по сути известно все факторы и даже к какому классу относится пример, но не известен один из факторов.
спасибо
Это из категории заполнение пропусков в данных. Это прогнозирование самого вероятного значения. Так можно делать. Вроде через KNN делается. Но думаю, что через любое другое можно просто построить модель и заполнить такие пропуски.
источник

S

Sunsh1ne in catboost_ru
Aleksei
Категориальный признак с сотней тысяч вариантов уже звучит неоптимальненько
да, согласен, я преувеличиваю, но не исключаю такого кол-ва, лучше перебдеть)
источник

S

Sunsh1ne in catboost_ru
Blen obema
Это из категории заполнение пропусков в данных. Это прогнозирование самого вероятного значения. Так можно делать. Вроде через KNN делается. Но думаю, что через любое другое можно просто построить модель и заполнить такие пропуски.
то есть построить другую модель (мультиклассовую) которая будет предсказывать нужный мне признак?
источник

Bo

Blen obema in catboost_ru
Sunsh1ne
то есть построить другую модель (мультиклассовую) которая будет предсказывать нужный мне признак?
да)
источник

Bo

Blen obema in catboost_ru
Можешь поискать где-то темы по заполнению пропусков (imputation of missing values) в литературе. Там найдёшь хорошие способы
источник

Bo

Blen obema in catboost_ru
ещё как вариант, можно разделить твой датасет на несколько классов в ручную, для которых ты предполагаешь схожесть значения этого признака. Ну, например, если у тебя неизвестный доход, но есть возраст, то можешь сделать 5 категорий: ребенок, подросток, молодой, в возрасте, пенсионер и для категорий высчитать средний возраст. И позаполнять им неизвестные значения в соответствии с категорией.
источник

S

Sunsh1ne in catboost_ru
спасибо за советы)
источник

A

Aнтон in catboost_ru
Sunsh1ne
Всем привет.
Подскажите, пожалуйста, можно ли у уже обученной модели (бинарная классификация) узнать самый вероятный категориальный фактор, если все остальные факторы известны. То есть по сути известно все факторы и даже к какому классу относится пример, но не известен один из факторов.
спасибо
А что означает - "самый вероятный категориальный фактор"?
источник