Size: a a a

2021 June 07

SK

Stanislav Kirillov in catboost_ru
Для пропусков лучше использовать  несигнальные qNaN
источник

AS

Alex Sladkov in catboost_ru
Понял, большое спасибо!
источник
2021 June 08

RY

Ruslan515 Y in catboost_ru
Добрый день. стоит задача классификация многоклассовая. Правильно ли понимаю, что в этом случае нужно использовать метрику loss_function = 'MultiClass'?
источник

ЕП

Евгений Петров... in catboost_ru
Да
источник

RY

Ruslan515 Y in catboost_ru
нашел такую формулировку  лосс-функции. а есть документация с более подробным объяснением?
источник

TB

Taras B in catboost_ru
Если я правильно помню, то можно даже не указывать ) Подав в качестве тагрета мультикласс - катбуст сам нужный лосс использует
источник

RY

Ruslan515 Y in catboost_ru
мне нужно обосновать выбор данной метрики. а если я не понимаю, то как объясню это людям?))
источник

ЕП

Евгений Петров... in catboost_ru
ну. a[i][j] — это значение формулы для j-го класса для i-го примера, t[i] — это метка (истинный класс) для i-го примера, w[i] — вес i-го примера (по умолчанию 1). прогноз (вектор вероятностей принадлежать каждому из классов) считается как сигмоида значений формулы для всех классов...
источник

RY

Ruslan515 Y in catboost_ru
спасибо! ща есть хоть какое то понимание)
источник

AM

Aleksandr Mikhailov ... in catboost_ru
странно, что от правильных ответов не зависит)
источник

ЕП

Евгений Петров... in catboost_ru
так t[i] же
источник

AM

Aleksandr Mikhailov ... in catboost_ru
а, окей
источник

IL

Ivan Lyzhin in catboost_ru
Можешь поискать по запросу “softmax crossentropy loss” - будет много объяснений
источник

RY

Ruslan515 Y in catboost_ru
ок. спасибо!
источник

RY

Ruslan515 Y in catboost_ru
сори за назойливость, но есть еще вопрос) используем данную лосс-функцию для обучения модели. затем какую метрику использовать для валидации?
источник
2021 June 09

AC

Andrey Chankin in catboost_ru
на валидации оценивается качество модели, какую хочешь метрику считай
источник
2021 June 11

I

Ivan in catboost_ru
Привет. Ребят, кто нибудь пробовал использовать catboost на Azure Databricks ? Выдает похожие ошибки как в https://github.com/catboost/catboost/issues/1687 .  Параметры: spark.task.cpus 2
spark.executor.cores 2 . Кластер использует Spark 3.0.1 и Scala 2.12
источник

RY

Ruslan515 Y in catboost_ru
дообучение возможно только на CPU: CatBoostError: catboost/cuda/train_lib/train.cpp:325: Training continuation for GPU is not yet supported. Но обучение одной партии занимает 30-40 минут(GPU 0.5-1 МИНУТА), таких кусков 10-15 - я не готов ждать 5-7 часов)) Можно ли  в итоге обучать на одном куске фрейма, потом на следующем и так до конца используя при этом GPU???
источник

D

Dima in catboost_ru
в катбусте это не поддерживается
источник

D

Dima in catboost_ru
если хотите gpu, то вам lightgbm подойдет,вроде
или xgboost, какой-то из них поддерживает дообучение на gpu
источник