Size: a a a

2019 October 09

IP

Igor Popov in catboost_ru
Ок, спасибо!
источник

Y

Young Freud 💎 in catboost_ru
Здравствуйте! Кто-нибудь знает, можно ли как-то получить закодированный катбустом вариант файла?
источник

P🐈

Pavel Tyavin 🐈 in catboost_ru
Young Freud 💎
Здравствуйте! Кто-нибудь знает, можно ли как-то получить закодированный катбустом вариант файла?
save_model load_model ?
источник

Y

Young Freud 💎 in catboost_ru
У меня были данные (в том числе и категориальные), катбуст их перевёл в векторное пространство и начал предсказывать на нем, можно ли увидеть, как именно он кодировал категории?
источник

P🐈

Pavel Tyavin 🐈 in catboost_ru
Young Freud 💎
У меня были данные (в том числе и категориальные), катбуст их перевёл в векторное пространство и начал предсказывать на нем, можно ли увидеть, как именно он кодировал категории?
У объекта Pool есть метод get_cat_feature_hash_to_string
источник

P🐈

Pavel Tyavin 🐈 in catboost_ru
Вот так ты можешь получить хэши:
from catboost import Pool
train_data = [['a', 'b'],['a', 'c'], ['e', 'd']]
train_label = [0,2,1]
train_pool = Pool(train_data, train_label, cat_features=[0,1])
train_pool.get_cat_feature_hash_to_string()
источник

Y

Young Freud 💎 in catboost_ru
Спасибо большое, это то, что нужно :)
источник

MK

Maxim Khrisanfov in catboost_ru
Igor Popov
Ок, спасибо за советы! У меня есть подозрения на разные параметры по умолчанию. Из параметров допустим выставлена  только лос функция multiclass, будут ли остальные параметры одинаковыми, если выбрать гпу и цпу?
насколько я знаю на GPU multiclass max_ctr_complexity=1 и увеличить его нельзя, поэтому может быть разница в качестве
источник

MK

Maxim Khrisanfov in catboost_ru
источник

MK

Maxim Khrisanfov in catboost_ru
вообще было бы круто получить возможность указать max_ctr_complexity>1 😊
источник

AD

Anna Veronika Dorogush in catboost_ru
Да, забыла я про мультикласс, добавим в доку! А имплементацию в ближайшее время не планируем:(
источник

IP

Igor Popov in catboost_ru
Maxim Khrisanfov
насколько я знаю на GPU multiclass max_ctr_complexity=1 и увеличить его нельзя, поэтому может быть разница в качестве
Спасибо! У меня как раз мультиклассовый классификатор
источник
2019 October 10

p

pin in catboost_ru
Stanislav ⚠️
Только вернулись с хакатона цифровой прорыв. Использовали катбуст для предсказания усталости пользователя долго работающего за пк 🙂к сожалению первое место не заняли, но результат все равно впечатляет.
А кто занял первое место и где можно посмотреть результаты?
источник

ЕТ

Евгений Томилов in catboost_ru
Скажите, пожалуйста, в пакете для R теперь есть catboost.cv. А где именно можно почитать варианты переменной type, например? Просмотрел документацию в том числе код на гите, но нигде нет или я просто не знаю, где смотреть.

Если я не ошибаюсь, то просто есть один тип и всё пока.

Cross-validate model.
Description
Cross-validate model.

Usage
catboost.cv(pool, params = list(), fold_count = 3,
 type = "Classical", partition_random_seed = 0, shuffle = TRUE,
 stratified = FALSE, early_stopping_rounds = NULL)
источник

S⚠

Stanislav ⚠️ in catboost_ru
pin
А кто занял первое место и где можно посмотреть результаты?
В вкашке есть группа цифровой прорыв. Там названия команд и баллы. К сожалению посмотреть прототипы и презентации других команд не дают. Прям секрет 🤔
источник

AA

Artem Andrienko in catboost_ru
Вроде раньше early_stopping=True автоматически выставлялся, если было валидационное множество?
Всё поменялось или меня память подводит
источник

AD

Anna Veronika Dorogush in catboost_ru
Всегда было False, сейчас тоже, но после обучения модель обрезается до лучшей итерации
источник

AA

Artem Andrienko in catboost_ru
хм
Ладно, спасибо
источник
2019 October 13

C

Combot in catboost_ru
Alert! Mmd Sahilu is a known spammer and is CAS banned. Ban is strongly recommended.
источник
2019 October 14

BA

Belchikov Anatoli in catboost_ru
Добрый день, ребят!

Тут такой момент: в java пакете catboost при использовании достаточно большого батча (300 документов, 15 признаков) после нескольких сотен итераций программа падает с SIGSEGV. Причиной оказался код освобождения памяти в ai_catboost_CatBoostJNIImpl.cpp:
    Y_SCOPE_EXIT(jenv, &catFeatureMatrixRowObjects, &catFeatureMatrixRows) {
       const auto size = catFeatureMatrixRows.size();
       for (size_t i = 0; i < size; ++i) {
           jenv->ReleaseIntArrayElements(
               catFeatureMatrixRowObjects[i],
               const_cast<jint*>(reinterpret_cast<const jint*>(catFeatureMatrixRows[i].data())),
               0);
       }
   };
Если закомментировать этот участок, то SIGSEGV не возникает, но память, соответственно, не очищается. Хотелось бы как-то исправить эту ошибку, не вызывая мемори лик. Возможно ли узнать ваше мнение, почему такой баг при ReleaseIntArrayElements вообще может происходить? Заранее спасибо!
источник