Size: a a a

2019 September 17

AS

Alexsey Shestacov in catboost_ru
KeyError: 'Doc'
источник

AD

Anna Veronika Dorogush in catboost_ru
Эта функция вычисляет важности фичей, надо вызывать get_object_importance
источник

AS

Alexsey Shestacov in catboost_ru
еще раз спасибо
источник

AS

Alexsey Shestacov in catboost_ru
CatBoostError: c:/goagent/pipelines/buildmaster/catboost.gittt/catboost/libs/documents_importance/ders_helpers.cpp:95: Error function YetiRank is not supported yet in ostr mode
источник

AS

Alexsey Shestacov in catboost_ru
Не могу понять что за ostr?
источник

AD

Anna Veronika Dorogush in catboost_ru
ostr - это тот object strength, то есть Object importance. Этот метод не поддержан для YetiRank
источник

d

dePuff in catboost_ru
Задача бинарной классификации. Захотелось зачем-то технику PseudoLabeling  попробовать с catBoost первый раз в жизни...

Есть какой-то вариант сохранить  неуверенность предыдущей модели на тестовых данных для финального прохода?

Ибо, если я превращаю предыдущие предсказания в 0, 1 по какому-то трешхолду - всё ок. Если нет - вляпываюсь в ошибку "You should specify target border parameter for target binarization.", что тоже трэшхолд.

Или моя хотелка математически не имеет смысла? :)
источник

d

dePuff in catboost_ru
Оверфитнуться на тестовые данные - не проблема, а цель )
источник

K

K-S in catboost_ru
dePuff
Задача бинарной классификации. Захотелось зачем-то технику PseudoLabeling  попробовать с catBoost первый раз в жизни...

Есть какой-то вариант сохранить  неуверенность предыдущей модели на тестовых данных для финального прохода?

Ибо, если я превращаю предыдущие предсказания в 0, 1 по какому-то трешхолду - всё ок. Если нет - вляпываюсь в ошибку "You should specify target border parameter for target binarization.", что тоже трэшхолд.

Или моя хотелка математически не имеет смысла? :)
Псевдолейбл на то и псевдолейбл, что мы на основании оценок принадлежности к классу выставляем конкретные лейблы.

Играйся с порогами, пробуй итерационный псевдолейбл итд.
источник

K

K-S in catboost_ru
Каггл что ли решаешь?😂
источник

d

dePuff in catboost_ru
)
источник

d

dePuff in catboost_ru
Вот за словосочетание "итеративный псевдолэйбл" спасибо. Читаю
источник

d

dePuff in catboost_ru
Я только учусь)
источник

K

K-S in catboost_ru
Псевдолейбл работает далеко не всегда, но при этом практически всегда лучше в соревнованиях заходит, чем другие популярные semi-supervised техники.

Но чтоб он работал, базовый алгоритм должен быть довольно качественный, а то только зашумишь выборку себе
источник

d

dePuff in catboost_ru
🙏
источник

D

Denis in catboost_ru
dePuff
Задача бинарной классификации. Захотелось зачем-то технику PseudoLabeling  попробовать с catBoost первый раз в жизни...

Есть какой-то вариант сохранить  неуверенность предыдущей модели на тестовых данных для финального прохода?

Ибо, если я превращаю предыдущие предсказания в 0, 1 по какому-то трешхолду - всё ок. Если нет - вляпываюсь в ошибку "You should specify target border parameter for target binarization.", что тоже трэшхолд.

Или моя хотелка математически не имеет смысла? :)
sample_weight
источник

d

dePuff in catboost_ru
Да, думал об этом. Попробую на всякий случай. спасибо
источник
2019 September 18

AS

Alexsey Shestacov in catboost_ru
@annaveronika Я посмотрел коннектер к шарпу, и то что сейчас в папке dotnet  к сожалению больше похоже на концепт чем на то я могу применить в проде и я даже не знаю как я могу ее допилить так что бы было можно
источник

IP

Igor Petrov in catboost_ru
Alexsey Shestacov
@annaveronika Я посмотрел коннектер к шарпу, и то что сейчас в папке dotnet  к сожалению больше похоже на концепт чем на то я могу применить в проде и я даже не знаю как я могу ее допилить так что бы было можно
тоже самое, решили поднять сервер на питоне
источник

AS

Alexsey Shestacov in catboost_ru
у меня в репе было решение с кодогенирацией
источник