Size: a a a

2019 July 19

Y

Young Freud 💎 in catboost_ru
Еще хотел спросить, а в чем разница между параметром  CatBoostClassifier и CatBoost?
источник

AD

Anna Veronika Dorogush in catboost_ru
Сколько у тебя разных значений таргета и чему они равны?
источник

AD

Anna Veronika Dorogush in catboost_ru
Young Freud 💎
Еще хотел спросить, а в чем разница между параметром  CatBoostClassifier и CatBoost?
Интерфейсы разные и Classifier по умолчанию делает классификацию, а CatBoos - rmse
источник

Y

Young Freud 💎 in catboost_ru
11 Значений (0,1,253,413,104,103,211,106,402,116,332)
источник

AD

Anna Veronika Dorogush in catboost_ru
Какая версия катбуста и как запускаешь обучение(код покажи)
источник

Y

Young Freud 💎 in catboost_ru
Версия : 0.15.2
источник

Y

Young Freud 💎 in catboost_ru
import numpy as np

from catboost import CatBoostClassifier, Pool

# initialize data

train_data = Pool("./data/ki_190625_Final280_0.csv", column_description="./data/train2.cd",delimiter=',')
test_data = Pool("./data/ki_93k_Final280_0.csv", column_description="./data/train3.cd",delimiter=',')  

model = CatBoostClassifier(learning_rate=0.03,
                          custom_metric=['Accuracy'])
# train the model
model.fit(train_data)
# make the prediction using the resulting model
preds_class = model.predict(test_data)
preds_proba = model.predict_proba(test_data)
print("class = ", preds_class)
print("proba = ", preds_proba)
источник

Y

Young Freud 💎 in catboost_ru
Это весь код
источник

ИБ

Иван Брагин in catboost_ru
Young Freud 💎
11 Значений (0,1,253,413,104,103,211,106,402,116,332)
Если это target то нужно брать CatBoostRegressor или просто CatBoost. CatBoostClassifier решает задачу классификации, то есть таргет - единички и нолики
источник

ИБ

Иван Брагин in catboost_ru
Young Freud 💎
Я поставил Accuracy и все равно такая же проблема(
Accuracy тут не loss а просто метрика которая логируется. Accuracy пока никто не умеет делать лоссом
источник

ИБ

Иван Брагин in catboost_ru
у меня по java пять вопрос, там есть метод predict который принимает float[] (не Float[]) то есть null туда не положить, а как nan передавать? Я их уже заменил на обучениие на -999 но впринципе с этим что то можно сделать?
источник

SK

Stanislav Kirillov in catboost_ru
Иван Брагин
у меня по java пять вопрос, там есть метод predict который принимает float[] (не Float[]) то есть null туда не положить, а как nan передавать? Я их уже заменил на обучениие на -999 но впринципе с этим что то можно сделать?
Float.NaN - вот правильный ответ на текущий момент
источник

SK

Stanislav Kirillov in catboost_ru
вообще кажется довольно логичным уметь применяться и к Float[]
источник

SK

Stanislav Kirillov in catboost_ru
с подстановкой Float.NaN для null
источник

SK

Stanislav Kirillov in catboost_ru
Если вдруг будет время - мы принимаем помощь (ну или сделай issue чтоб не забыли)
источник

Y

Young Freud 💎 in catboost_ru
Иван Брагин
Если это target то нужно брать CatBoostRegressor или просто CatBoost. CatBoostClassifier решает задачу классификации, то есть таргет - единички и нолики
Эти значения, это код ошибки. Разве для его предсказания не подходит CatBoostClassifier?
источник

ИБ

Иван Брагин in catboost_ru
Да надо как нибудь покоммитить, что бы в будущем самому проблемы легче решать, всё боюсь этих ваших плюсов))
а есть описание политики создания PR гдето, ну там с форка или бранчи создавать, как тесты гоняются...
источник

AD

Anna Veronika Dorogush in catboost_ru
Иван Брагин
Если это target то нужно брать CatBoostRegressor или просто CatBoost. CatBoostClassifier решает задачу классификации, то есть таргет - единички и нолики
На самом деле Classifier решает проблему мультиклассификации тоже, причем должен запускать мультиклассификацию по умолчанию, если значений таргета больше двух. Почему-то этого не произошло, посмотрим.
Пока поставь loss_function='MultiClass'
источник

IP

Igor Petrov in catboost_ru
Anna Veronika Dorogush
Пока что не поддержаны use_best_model и best_iteration для дообучения. Поддержим, вот issue https://github.com/catboost/catboost/issues/911
А как выбрать тогда лучшую итерацию?
источник

SK

Stanislav Kirillov in catboost_ru
Иван Брагин
Да надо как нибудь покоммитить, что бы в будущем самому проблемы легче решать, всё боюсь этих ваших плюсов))
а есть описание политики создания PR гдето, ну там с форка или бранчи создавать, как тесты гоняются...
На самом деле код джава обертки - это очень тонкая прослойка плюсов + джава код
источник