Size: a a a

2019 November 21

ДБ

Даниил Богданов in catboost_ru
Если не ошибаюсь, в Хроме есть встроенный переводчик, в чем проблема?
источник

ДБ

Даниил Богданов in catboost_ru
И, кажется, что сейчас без английского никуда
источник

Аa

Андрей amber4eg in catboost_ru
не, ну кто-то же на qaru ходит  😁
источник

AG

Artyom Gruzdev in catboost_ru
пока контент не устраивает по качеству для выкладывания в публичный доступ, ну и дело не в переводе, а в системном изложении
источник

E

Evgeny in catboost_ru
Привет!
Есть данные, в которых каждая фича категориальная с большим количеством (несколько тысяч) значений. Задача: бинарная классификация.
В данных очень много записей с одинаковыми значениями фичей.
Можно как-то передать катбусту данные, агрегированные по одинаковым фичам?
То есть, например, вместо 100 строк с одинаковыми значениями фичей, из которых 20 имеют метку 1 и 80 метку 0, оставляем одну строку с меткой 0.2 (или что-то типа того)?  
Хочется, чтобы при этом все эвристики для работы с кат фичами в катбусте сохранились.
Может вопрос глупый, я только начал во всем этом разбираться.
источник

A

Alexandr in catboost_ru
А зачем в сете одинаковые строки?
источник

E

Evgeny in catboost_ru
Например 10 показов одного рекламного банера пользователям с одинаковыми параметрами, из которых только один привел к конверсии. У девяти будет метка 0, у одного 1
источник

IL

Ivan Lyzhin in catboost_ru
Как вариант, можно веса передать, которые будут отражать, сколько раз встречается строка.
источник

D

Dasha in catboost_ru
Коллеги, собираю модель

cat_features = ['action', 'operation', 'platform', 'status']

cv_dataset = Pool(data=train_pool,
                 label=train_label.tolist(),
                 cat_features=cat_features)

params = {"iterations": 100,
         "depth": 2,
         "loss_function": "Logloss",
         "verbose": False}

scores = cv(train_data,
           params,
           fold_count=5,
           plot="True")


catboost.cv пишет:
CatBoostError: Invalid data type={}: data must be list(), np.ndarray(), DataFrame(), Series(), FeaturesData  scipy.sparse matrix or filename str().

на train_label.tolist() и cat_features

Что делаю не так?
источник
2019 November 22

A

Alex.Ash in catboost_ru
Данные, с ними не так. Отдельно выведите .tolist() и посмотрите что в нём получается
источник

E

Evgeny in catboost_ru
Ivan Lyzhin
Как вариант, можно веса передать, которые будут отражать, сколько раз встречается строка.
Спасибо, попробую
источник

AY

Alexey Yurasov in catboost_ru
Привет!
Есть ли способ использовать catboost на hackerrank? Что то я в тупике 🥶
источник

AA

Aleksey Astafiev in catboost_ru
Коллеги, подскажите. Есть что-то хорошее для catboost в golang?
источник

I

Ivan in catboost_ru
источник

AA

Aleksey Astafiev in catboost_ru
Вы подтвердили, что ничего... спасибо
источник

Bo

Blen obema in catboost_ru
Aleksey Astafiev
Вы подтвердили, что ничего... спасибо
Есть ли ml в голанг?
источник

Bo

Blen obema in catboost_ru
Просто интересно
источник
2019 November 23

ДБ

Даниил Богданов in catboost_ru
Здравствуйте, скажите, планируется ли добавить snapshot'ы в grid_search?
источник

AD

Anna Veronika Dorogush in catboost_ru
Да, обязательно сделаем
источник

ДБ

Даниил Богданов in catboost_ru
Буду очень ждать :)
источник