Size: a a a

2020 May 18

AD

Anna Veronika Dorogu... in catboost_ru
Это просто еще одна метрика, ее можно задать в параметре eval_metric
источник

OT

Oscar Tempter in catboost_ru
понятно, как её задать ?
источник

OT

Oscar Tempter in catboost_ru
CatBoostError: tools/enum_parser/enum_serialization_runtime/enum_runtime.cpp:32: Key 'PRAUC' not found in enum ELossFunction. Valid options are: 'Logloss', 'CrossEntropy', 'CtrFactor', 'RMSE', 'Lq', 'MAE', 'Quantile', 'Expectile', 'LogLinQuantile', 'MAPE', 'Poisson', 'MSLE', 'MedianAbsoluteError', 'SMAPE', 'Huber', 'Tweedie', 'MultiClass', 'MultiClassOneVsAll', 'PairLogit', 'PairLogitPairwise', 'YetiRank', 'YetiRankPairwise', 'QueryRMSE', 'QuerySoftMax', 'QueryCrossEntropy', 'StochasticFilter', 'StochasticRank', 'PythonUserDefinedPerObject', 'UserPerObjMetric', 'UserQuerywiseMetric', 'R2', 'NumErrors', 'FairLoss', 'AUC', 'Accuracy', 'BalancedAccuracy', 'BalancedErrorRate', 'BrierScore', 'Precision', 'Recall', 'F1', 'TotalF1', 'MCC', 'ZeroOneLoss', 'HammingLoss', 'HingeLoss', 'Kappa', 'WKappa', 'LogLikelihoodOfPrediction', 'NormalizedGini', 'PairAccuracy', 'AverageGain', 'QueryAverage', 'PFound', 'PrecisionAt', 'RecallAt', 'MAP', 'NDCG', 'DCG', 'FilteredDCG', 'MultiRMSE', 'Combination'.
источник

AD

Anna Veronika Dorogu... in catboost_ru
сделай, пожалуйста, issue, посмотрим
источник

OT

Oscar Tempter in catboost_ru
а сорри, перезагружу юпитер, наверное не импортнулась последняя версия
источник

AD

Anna Veronika Dorogu... in catboost_ru
вроде в 0.23.1 уже должна была быть
источник

OT

Oscar Tempter in catboost_ru
а по какому принципу вычисляется prauc ? не аналогично тому как это делается в sklearn ?
precision, recall, thresholds = precision_recall_curve(np.asarray(target), np.asarray(approx))
       pr_auc = auc(recall, precision)
источник

OT

Oscar Tempter in catboost_ru
у меня очень сильно отличаются значения которые считаются в sklearn и нативно в катбусте
источник
2020 May 19

AM

Alexander Manushin in catboost_ru
Здравствуйте! Проблема с использованием ранее сохранённой в файл модели:
1. Инициализирую, обучаю, сохраняю модель
model = CatBoostRegressor(iterations=200,
                          learning_rate=0.05,
                          depth=6,
                          loss_function='MAE',
                          random_seed=1)

# fit model
model.fit(all_pool, silent=True)

# save model into a file
model.save_model('model_catboost')
2. Затем загружаю её из файла:
from_file = CatBoostRegressor()
from_file.load_model('model_catboost')
3. Пытаюсь сделать с помощью загруженной модели прогноз:
from_file.predict(X)
4. Вместо прогноза появляется ошибка: CatBoostError: Only one of parameters ['verbose', 'logging_level', 'verbose_eval', 'silent'] should be set

В чём может быть проблема? Вроде всё как в документации написано делаю. Заранее извиняюсь, если подобная проблема уже обсуждалась (быстрый поиск по чату результатов не дал).
источник

IL

Ivan Lyzhin in catboost_ru
Какая версия катбуста?
источник

IL

Ivan Lyzhin in catboost_ru
Была такая проблема, но ее пофиксили уже.   https://github.com/catboost/catboost/issues/696
Не уверен, что этот фикс уже на pypi. Но можно собрать из исходников.
источник

MF

Maxim FromSiberia in catboost_ru
catboost-0.23.exe fit --cd cd --task-type CPU -f train.csv --train-dir trdir --delimiter , --verbose 10 -
i 1000 --loss-function Logloss --model-file m.bin

Добрый день! Запускаю такую команду, получаю

Learning rate set to 0.5

Меняю CPU -> GPU, получаю

Learning rate set to 0.019201.

train.csv: 27 млн строк с весами, 27 фич, нет катфич, бинарная классификация.

Ожидаема ли такая разница в лр? Как ее можно объяснить? Спасибо.
источник

AD

Anna Veronika Dorogu... in catboost_ru
Очень странно, не похоже, чтобы цпу выставлял на 1000 итераций 0.5 при трейне на 27 млн строк
источник

AD

Anna Veronika Dorogu... in catboost_ru
сделай, пожалуйста, issue, посмотрим
источник

MF

Maxim FromSiberia in catboost_ru
Anna Veronika Dorogush
сделай, пожалуйста, issue, посмотрим
источник

MF

Maxim FromSiberia in catboost_ru
Anna Veronika Dorogush
сделай, пожалуйста, issue, посмотрим
Какие сроки ориентировочные?
источник

AD

Anna Veronika Dorogu... in catboost_ru
Сроков, к сожалению, подсказать не могу. Пока что нет рук посмотреть issue, когда появятся, посмотрим.
источник
2020 May 20

S

Sergii in catboost_ru
Всем привет, хотел спросить какой самый разумный автоматический способ подбора количества итераций с помощью кроссвалидации? с использованием early_stopping_rounds
Пока пришел к чему-то такому:
cv_data = cv(...)
cv_data.iloc[cv_data['test-Logloss-mean'].argmin()]['iterations']

вроде делает то, что надо, но вдруг есть способ попроще :)
источник

AM

Alexander Manushin in catboost_ru
Ivan Lyzhin
Какая версия катбуста?
'0.23'
источник

AM

Alexander Manushin in catboost_ru
Читал эту тему, а в какой версии её уже пофиксили и как и откуда её установить можно?

Попробовал так:
from_file = CatBoost().load_model('model_catboost')
from_file.predict(X)

👆Так работает.  Пока так буду загружать.

Но при загрузке таким образом:
from_file = CatBoostRegressor()
from_file.load_model('model_catboost')

или так: from_file = CatBoostRegressor().load_model('model_catboost')

далее при попытке предсказания:
from_file.predict(X)
выдаёт вышеуказанную ошибку.
источник