Size: a a a

2021 March 31

KS

Kirill Suvorov in catboost_ru
Ivan Lyzhin
Привет!
Во-первых, пары всегда генерируются с объектами из одной группы.
Во-вторых, пары можно задать вручную при создании пула или установить параметр метрики для числа генерируемых пар (PairLogit:max_pairs=50). По-умолчанию, буду сгенерированы все возможные пары.
В случае YetiRankPairwise по сути есть 2 набора пар. Один набор используется для расчета метрики PairLogit и им можно управлять, задав пары вручную.
Второй набор используется при расчете градиентов, он динамический и им управлять нельзя. Подробно о том, как он генерируется, можно глянуть в статье http://proceedings.mlr.press/v14/gulin11a.html
Большое спасибо 👍
источник

T

Tj in catboost_ru
Добрый день, можете пожалуйста  прокомментировать почему CatBoost сильно теряет в качестве для датасетов Microsoft и Yahoo  ?
источник

T

Tj in catboost_ru
источник

T

Tj in catboost_ru
Это связано с :

1. Мульти классификация ?

2. Данные сильно разряжены ?

3. Оба 1+2 ?

4. Старая версия CatBoost-а 0.5.2.1  ?  На новых версиях это все уже пофиксено ?

5. Что-то другое ?
источник

s

st_myst in catboost_ru
Думаю, особености данных
источник

T

Tj in catboost_ru
источник

Аa

Андрей amber4eg... in catboost_ru
0.5 - это очень старая версия. Кот в районе 0.20х версий значительно ускорился и прибавил в точности
источник

T

Tj in catboost_ru
Андрей amber4eg
0.5 - это очень старая версия. Кот в районе 0.20х версий значительно ускорился и прибавил в точности
Спасибо!
источник

T

Tj in catboost_ru
Tj
Добрый день, можете пожалуйста  прокомментировать почему CatBoost сильно теряет в качестве для датасетов Microsoft и Yahoo  ?
Хорошо бы если разработчики это прокомментировали пожалуйста.
@kizill
источник

Аa

Андрей amber4eg... in catboost_ru
Мне кажется, они слишком вежливые для правильного комментария
источник

T

Tj in catboost_ru
тогда я не понимаю в чем вежливость 😆
источник

SK

Stanislav Kirillov in catboost_ru
Ох, ну там довольно странный сеттинг, в котором они вместо встроенного ранжирующего лосса использовали руками сделанный one-vs-all
источник

T

Tj in catboost_ru
Stanislav Kirillov
Ох, ну там довольно странный сеттинг, в котором они вместо встроенного ранжирующего лосса использовали руками сделанный one-vs-all
то есть они просто не то измерение лосса и все должно работать нормально ?
источник

SK

Stanislav Kirillov in catboost_ru
у них метрика ndcg
источник

T

Tj in catboost_ru
у CatBoost-а нет проблем с высоко разряженными данными ?
источник

T

Tj in catboost_ru
Tj
у CatBoost-а нет проблем с высоко разряженными данными ?
это основной вопрос для меня
источник

s

st_myst in catboost_ru
Tj
у CatBoost-а нет проблем с высоко разряженными данными ?
Раньше была, но, вроде, обещали пофиксить
источник

IL

Ivan Lyzhin in catboost_ru
По-моему, основная проблема заключается в этом предложении: “We compute the expected relevance when class-probabilities are available (otherwise take the most probable relevance, for Catboost)”. Я это понимаю так, что они в катбусте не нашли predict_proba (неужели его тогда не было?) и использовали просто predict. От этого, естественно, может сильно портиться ndcg.
источник

T

Tj in catboost_ru
Извините, я новичок 😂😂
источник

T

Tj in catboost_ru
Можете коротко написать проблема с разряженными данными решена или нет
источник