Size: a a a

2019 May 18

OT

Oscar Tempter in catboost_ru
К каждому из классов
источник

Д

Дмитрий in catboost_ru
Понял, спасибо большое)
источник

Д

Дмитрий in catboost_ru
Не сходится в 1-2%, странно
источник

IC

Igor Cage in catboost_ru
Кто нибудь может подсказать как загружать train_data и train_lables из файла? По примерам на сайте катбуста не смог понять как это сделать, похоже я слишком туп 🙈
источник

Аa

Андрей amber4eg in catboost_ru
загрузи их в pandas.DataFrame, а его отдай котику
источник

AD

Anna Veronika Dorogush in catboost_ru
Igor Cage
Кто нибудь может подсказать как загружать train_data и train_lables из файла? По примерам на сайте катбуста не смог понять как это сделать, похоже я слишком туп 🙈
Можно создать класс Pool из файла. По умолчанию считается, что в первой колонке таргет, в остальных числовые фичи. Если это не так, надо еще сделать файл с column description, в котором будет написано, что в какой колонке
источник

IC

Igor Cage in catboost_ru
спасибо буду копать)
источник
2019 May 19

S

Sunsh1ne in catboost_ru
Подскажите, как заставить модель выдать ранжированный список наиболее вероятных вариантов. Нашел как обучать модель ранжирования, но не понимаю, как получить топ 10 результатов от модели.
Вот, например, этот туториал
https://github.com/catboost/catboost/tree/master/catboost/tutorials/ranking
То есть я хочу понять, как Яндекс использует CatBoost в ранжировании поисковой выдачи
источник

AD

Anna Veronika Dorogush in catboost_ru
нужно сделать предсказание на всем, отсортировать по полученному скору и выбрать топ 10
источник

S

Sunsh1ne in catboost_ru
то есть у Яндекса миллионы страниц по запросу и они по всем делают предсказания и сортируют по полученному скору от CatBoost?
источник

AD

Anna Veronika Dorogush in catboost_ru
Сначала другими методами выбирается топ сколько-то, которые потом будем ранжировать.
источник

S

Sunsh1ne in catboost_ru
понял, вопросов нет, спасибо за помощь)
источник
2019 May 20

Д

Дмитрий in catboost_ru
Подскажите, пожалуйста, почему AUC ROC датасет1 > датасет2, но при этом accuracy1 < accuracy2?
источник

S

Sunsh1ne in catboost_ru
Дмитрий
Подскажите, пожалуйста, почему AUC ROC датасет1 > датасет2, но при этом accuracy1 < accuracy2?
Это разные метрики, в этом видео рассказывается что такое AUC и много других полезных вещей

https://youtu.be/xl1fwCza9C8
источник

Д

Дмитрий in catboost_ru
Спасибо
источник

A

Aнтон in catboost_ru
Дмитрий
Подскажите, пожалуйста, почему AUC ROC датасет1 > датасет2, но при этом accuracy1 < accuracy2?
Простите за ответ в традициях it-форумов, но по-моему accuracy вообще редко для каких задач годится
источник

Bo

Blen obema in catboost_ru
Aнтон
Простите за ответ в традициях it-форумов, но по-моему accuracy вообще редко для каких задач годится
почему?
источник

Д

Дмитрий in catboost_ru
А бинарной классификации с обучением с учителем я бы даже ее считал вместо AUC
источник

Д

Дмитрий in catboost_ru
При условии, что классы сбалансированы
источник

ИБ

Иван Брагин in catboost_ru
Дмитрий
При условии, что классы сбалансированы
И при условии что бизнес задача именно в этой метрике, ROC AUC значительно лучше отражает качесто разбиения классов
источник