Size: a a a

2020 March 30

ВС

Владислав Сафоничев in catboost_ru
Stanislav Kirillov
нет, для применения не нужен GPU
Подтверждаю
источник

AB

Artem Boyarintsev in catboost_ru
Но при попытке загрузить модельку с текстовыми фичами появляется такая ошибка: Got unknown CatBoostError: catboost/libs/model/model.cpp:690: Got unknown partId = text_process_v2.
источник

AB

Artem Boyarintsev in catboost_ru
Если моделька была обучена без текстовых фич - такой проблем не возникает.
источник

SK

Stanislav Kirillov in catboost_ru
надо обновить версию катбуста на сервере
источник

SK

Stanislav Kirillov in catboost_ru
ну в смысле там, где все применяется
источник

AB

Artem Boyarintsev in catboost_ru
Окей, попробуем
источник

AB

Artem Boyarintsev in catboost_ru
Спасибо!
источник

SN

Sergey Novozhilov in catboost_ru
Добрый день! Коллеги, пожалуйста, как можно настраивать параметры графиков, когда plot=True
В примерах в документации шкала "y" имеет верхнюю границу 0.5, 0.6 и т.д.
У меня она всегда 1 , а график реально интересует, когда ошибка имеет 0.001 и ниже
начинаются значения фунции ошибок, конечно, с единицы, как катбусту сказать, чтобы показывал график не с начала, а после нескольких итераций?
источник

AD

Anna Veronika Dorogush in catboost_ru
никак, но там вроде можно выделить область, на которую хочется смотреть
источник

SN

Sergey Novozhilov in catboost_ru
Да, Вероника, здравствуйте! Я как раз устал бегать за этими загадочными областями мышкой, они так занятно себя ведут ))
источник

AD

Anna Veronika Dorogush in catboost_ru
Предлагаю сделать issue на гитхабе, мы тогда в какой-то момент добавим возможность границы выставлять
источник

SN

Sergey Novozhilov in catboost_ru
Да, написал issue в github
источник
2020 March 31

SN

Sergey Novozhilov in catboost_ru
Здравствуйте!
Пытаюсь запускать catboostClassifier в яндекс Облаке, данных мало, 5тыс записей * 125 признаков (специально взял поменьше), в виртуальной машине 16Gb памяти и 16vCPU,
1. наблюдаю странную картину в мониторе ВМ - очень большой траффик с диском, с чем это может быть связано?
2. а также очень надолго зависает на строчке в gridsearch
Estimating final quality...

как бы уменьшить время этого estimating? Что в это время происходит? Сами вычисления происходят практически мгновенно
источник

C

Combot in catboost_ru
источник

NT

Nikolay Tolstov in catboost_ru
indices, scores = model.get_object_importance(
   val_pool,
   train_pool,
   importance_values_sign='Negative',
   type='Average',
   )
источник

NT

Nikolay Tolstov in catboost_ru
я использую этот код чтобы получтить важность объектов для бинарной классификации. В модели eval_metric = AUC
источник

NT

Nikolay Tolstov in catboost_ru
на выходе получаю indices одного класса
источник

NT

Nikolay Tolstov in catboost_ru
что тут не так?
источник

PB

Pavel Baidaus in catboost_ru
Sergey Novozhilov
Здравствуйте!
Пытаюсь запускать catboostClassifier в яндекс Облаке, данных мало, 5тыс записей * 125 признаков (специально взял поменьше), в виртуальной машине 16Gb памяти и 16vCPU,
1. наблюдаю странную картину в мониторе ВМ - очень большой траффик с диском, с чем это может быть связано?
2. а также очень надолго зависает на строчке в gridsearch
Estimating final quality...

как бы уменьшить время этого estimating? Что в это время происходит? Сами вычисления происходят практически мгновенно
1. Plot =True стоит? В модел.фит
источник

SN

Sergey Novozhilov in catboost_ru
да, plot=True, только это в gridsearch, в model.fit никаких проблем с графиками нет. И вообще с фит нет проблем, только с gridsearch
источник