Size: a a a

2019 September 05

PB

Pavel Baidaus in catboost_ru
дрова последние стояли
источник

Y

Young Freud 💎 in catboost_ru
Подскажите пожалуйста, из-за чего может быть такое?
источник

Y

Young Freud 💎 in catboost_ru
train2 выглядит вот так
источник
2019 September 09

AA

Artem Andrienko in catboost_ru
Доброго дня
Может кто подсказать, из Pool объекта можно как-нибудь вытащить значения колонок с категориальными переменными?
источник

AD

Anna Veronika Dorogush in catboost_ru
Artem Andrienko
Доброго дня
Может кто подсказать, из Pool объекта можно как-нибудь вытащить значения колонок с категориальными переменными?
Нельзя, там не хранятся строки, там уже хэши лежат. И к ним нет доступа.
источник

AD

Anna Veronika Dorogush in catboost_ru
Young Freud 💎
Подскажите пожалуйста, из-за чего может быть такое?
В датасете одна колонка, в cd файле описано много колонок.
источник

AA

Artem Andrienko in catboost_ru
А, отсюда вероятно и растут ноги экономии памяти для категорий
Жаль, но спасибо
источник
2019 September 10

Аa

Андрей amber4eg in catboost_ru
источник

Аa

Андрей amber4eg in catboost_ru
источник

Аa

Андрей amber4eg in catboost_ru
from catboost import CatBoostClassifier, Pool, cv, utils


P_full = Pool(X, y)
parameters = {
   'eval_metric': 'MultiClass',
   'iterations': 1000,
   'metric_period': 100,
   'loss_function': 'MultiClass',
   'l2_leaf_reg': 30,
   'random_seed': 0,
   'custom_metric': ['F1', 'Recall']
}
scores = cv(P_full,
           params=parameters,
           stratified=True,
           fold_count=3
           )


Оценило время работы в 20 часов на X размером 3256, 26075
источник

Аa

Андрей amber4eg in catboost_ru
И с boost_from_average вопросы. У меня на 16.4 RMSE: Train: 598.57. Validation: 587.36. Holdout: 599.21
Тот же самый код, тот же самый датасет, но 0.17 - Train: 597.95. Validation: 759.12. Holdout: 778.29
источник

SK

Stanislav Kirillov in catboost_ru
Это CPU или GPU?
источник

SK

Stanislav Kirillov in catboost_ru
Датасет открытый?
источник

Аa

Андрей amber4eg in catboost_ru
CPU, закрытый
источник

SK

Stanislav Kirillov in catboost_ru
Можешь на GPU тест прогнать ?
источник

Аa

Андрей amber4eg in catboost_ru
да
источник

Аa

Андрей amber4eg in catboost_ru
Возможно, я некорректно тестирую из-за "Stopped by overfitting detector" и use_best_model. Метрика Train - от последней итерации, validation - от best_model.
источник

ND

Nikita Dmitriev in catboost_ru
А параметры у тебя подобранные или дефолты?
Если на дефолтах запустить такая же картина?
источник

Аa

Андрей amber4eg in catboost_ru
{
 "iterations": 5000,
 "od_wait": 1000,
 "verbose": 50,
 "learning_rate": 0.005
}
источник

SK

Stanislav Kirillov in catboost_ru
Сильно быстрее переобучился 0.17
источник