Телеграмм чат группы catboost_ru страница 288

parrot.ru

Рейтинг популярных групп и каналов

В рейтинге участвует:

групп:

каналов:

Виртуальный сервер на SSD - недорого!

Аренда выделенных и виртуальных серверов (VDS/VPS), хостинг, аренда IP-адресов, администрирование, круглосуточная поддержка

qwarta.ru подробнее

Резервное копирование с проверкой на вирусы!!!

Удобный сервис создания резервных копий на любой сервер сети интернет. Отслеживайте изменения, проверяйте на вирусы. Надежно защитите свой бизнес!

go.backupland.com

Выбираете сервер? Любая конфигурация на заказ!

Аренда физических серверов любых конфигураций под любые запросы - 1С бухгалтерия, игровые сервера, нагруженные проекты, интернет-магазины!

qwarta.ru подробнее

Size: a a a

catboost_ru

743 membersпожаловаться на группу

2020 June 04

SN

Sergey Novozhilov in catboost_ru

Здравствуйте!

Я взвешиваю классы :
scale_pos_weight=en.scale_pos_weight

и получаю такой вывод метрик (средние). Для метрик, которые используют веса, выводится два значения - use_weights=false и use_weights=true

разница иногда разительная, здесь для precision просто огромная.

Это что означает? То, что взвешивание оказало сильный еффект? Или смотреть надо как-то иначе?
*************** start printing custom metrics *************
Kappa: 0.5918155277161626
Accuracy:use_weights=false: 0.7280166666666665
Precision:use_weights=false: 0.29840621783634946
Recall:use_weights=false: 0.8860228452751818
MCC:use_weights=true: 0.6017257779176726
MCC:use_weights=false: 0.4042244689136794
Accuracy:use_weights=true: 0.7958920724035303
AUC: 0.8688929175758742
Logloss: 0.49361973416889854
Precision:use_weights=true: 0.7508035767474385
Recall:use_weights=true: 0.8860228452751818
F1:use_weights=false: 0.4463146739245634
F1:use_weights=true: 0.8127800545060098
=============== end printing custom metrics ================

источник

21:21пожаловаться #1

2020 June 05

p

pshn in catboost_ru

Всем привет!
А подскажите, в какой версии добавился Tweedie? В документации его вижу, обновляю до последней доступной сборки - и выкидывает ошибку.

источник

09:49пожаловаться #2

VB

Victor Bartel in catboost_ru

Добрый день, огромное вам спасибо (еще раз) за проведенный вами вчера туториал.

источник

09:49пожаловаться #3

IL

Ivan Lyzhin in catboost_ru

Tweedie появился в версии 0.23

источник

09:52пожаловаться #4

IL

Ivan Lyzhin in catboost_ru

Есть туториал на гитхабе https://github.com/catboost/tutorials/blob/master/regression/tweedie.ipynb

catboost/tutorials

CatBoost tutorials repository. Contribute to catboost/tutorials development by creating an account on GitHub.

источник

09:53пожаловаться #5

p

pshn in catboost_ru

Tweedie появился в версии 0.23

Спасибо🙏

источник

12:04пожаловаться #6

SF

Stepan Frolov in catboost_ru

Добрый день.
Есть ли возможность в custom_metric использовать свою функцию? Вижу такую возможность только для loss_function и eval_metric. Меня интересует Specificity, которая, на сколько я вижу, не реализована в catboost

источник

14:03пожаловаться #7

SN

Sergey Novozhilov in catboost_ru

А можно посмотреть где-то вчерашний туториал в записи, не смог поучаствовать, жалею

источник

16:02пожаловаться #8

YK

Yerzhan Karatay in catboost_ru

Обещали на почту скинуть вместе с результатами конкурса, надо подождать наверно, сам где-то процентов 30 посмотрел.

источник

16:11пожаловаться #9

ND

Nikita Dmitriev in catboost_ru

Добрый день.
Есть ли возможность в custom_metric использовать свою функцию? Вижу такую возможность только для loss_function и eval_metric. Меня интересует Specificity, которая, на сколько я вижу, не реализована в catboost

Привет!
в custom_metric сейчас нельзя использоовать свою функцию. А чем не подходит eval_metric?

источник

16:12пожаловаться #10

ND

Nikita Dmitriev in catboost_ru

Sergey Novozhilov

А можно посмотреть где-то вчерашний туториал в записи, не смог поучаствовать, жалею

Как запись будет готова, скину ссылку сюда

источник

16:13пожаловаться #11

SF

Stepan Frolov in catboost_ru

Nikita Dmitriev

Привет!
в custom_metric сейчас нельзя использоовать свою функцию. А чем не подходит eval_metric?

Я не хочу, чтобы обнаружение переобучения производилось по этой метрике, но хотел смотреть на ее значения, поэтому eval_metric не подходит. Т.е. такой возможности не предусмотрено и вы не планируете ее реализовывать?

источник

16:15пожаловаться #12

ND

Nikita Dmitriev in catboost_ru

Можно выставить use_best_model=False и тогда модель не будет обрезаться по этой метрике

источник

16:16пожаловаться #13

SF

Stepan Frolov in catboost_ru

Да, понимаю, но это сильно увеличивает время на лишнее обучение. Но мб попробую, спасибо

источник

16:19пожаловаться #14

ND

Nikita Dmitriev in catboost_ru

Это правда
Можете создать issue на гитхабе, что бы задачка такая у нас была?

источник

16:19пожаловаться #15

SF

Stepan Frolov in catboost_ru

Да, конечно
А по поводу реализации встроенной метрики Specificity имеет смысл создавать issue?

источник

16:21пожаловаться #16

ND

Nikita Dmitriev in catboost_ru

Да, давай и это тоже

источник

16:26пожаловаться #17

SF

Stepan Frolov in catboost_ru

Создал issue. Возник еще один вопрос:
Есть данные:

X_train, X_validation, y_train, y_validation = train_test_split(X, y, train_size=0.75, random_state=42)

train_pool = Pool(data=X_train, label=y_train)
validation_pool = Pool(data=X_validation, label=y_validation)
train_validation_pool = Pool(data=X, label=y)

Есть модель:

overfitting_test_model = CatBoostClassifier(
    random_seed=42,
    iterations=20
)

При запуске обычного обучения:

overfitting_test_model.fit(
    train_pool,
    eval_set=validation_pool,
    plot=True
)

лучший logloss - 0.4402910

При запуске grid_search с теми же параметрами:

grid = {'iterations': [20]}

overfitting_test_model.grid_search(grid, 
                                   train_validation_pool,
                                   plot=True,
                                   train_size=0.75
                                  )

logloss - 0.5742920

Что я делаю не так? Вроде как должна получаться одинаковая модель

источник

18:21пожаловаться #18

S

Sergii in catboost_ru

попробуйте зафиксировать learning_rate

источник

18:28пожаловаться #19

SF

Stepan Frolov in catboost_ru

попробуйте зафиксировать learning_rate

Зафиксировал на 0.02. Для fit logloss стал - 0.5890836609, для grid_search - 0.5969752. Т.е. разница все равно есть

источник

18:39пожаловаться #20