Size: a a a

2019 April 09

OS

Oleg Shapovalov in catboost_ru
Igor Petrov
0.13.1 нельзя передать категориальные признаки названием столбцов
Invalid cat_features[0] = Запрос вручную value type=<class 'str'>: must be int().
по-моему в 0.14 это исправили
источник

AD

Anna Veronika Dorogush in catboost_ru
Igor Petrov
0.13.1 нельзя передать категориальные признаки названием столбцов
Invalid cat_features[0] = Запрос вручную value type=<class 'str'>: must be int().
Да, в 0.14.0 только, сейчас зальем новые бинари на pypi
источник

ИБ

Иван Брагин in catboost_ru
Maxim Khrisanfov
Иван Спасибо за статью.
Из статьи: bagging_temperature - Уменьшение значения ведет к увеличению оверфита.
Это точно так? В том видео, на которое ты ссылаешься, не говорится такое, насколько я помню там речь шла о random_strength и L2.
Могу ошибаться, я понимаю этот параметр из документации https://catboost.ai/docs/concepts/parameter-tuning.html так что если мы увеличиваем его, то увеличивается рандомизация весов, если он равен нулю, то веса всех объектов всегда равны единице, лучше конечно если кто то из разработчиков ответит, я и в статье поправлю если там ошибка
источник

IP

Igor Petrov in catboost_ru
Anna Veronika Dorogush
Да, в 0.14.0 только, сейчас зальем новые бинари на pypi
Спасибо! Ждём
источник

ИБ

Иван Брагин in catboost_ru
В видео говорится что этот параметр стоит потюнить, а как именно его тюнить я, помоему, сделал вывод из документации
источник

AD

Anna Veronika Dorogush in catboost_ru
Иван Брагин
Могу ошибаться, я понимаю этот параметр из документации https://catboost.ai/docs/concepts/parameter-tuning.html так что если мы увеличиваем его, то увеличивается рандомизация весов, если он равен нулю, то веса всех объектов всегда равны единице, лучше конечно если кто то из разработчиков ответит, я и в статье поправлю если там ошибка
Да, если увеличивать значение, то увеличивается рандомизация. Мы скоро выложим отдельную доку про все наши семплирования, там формулы будут, будет понятнее.
источник

MK

Maxim Khrisanfov in catboost_ru
Я правильно понимаю, что если установить has_time=True, то параметры random_strength и bagging_temperature перестают работать - рандомизации уже нет?
источник

AD

Anna Veronika Dorogush in catboost_ru
нет, все остается, единственное - фиксируется одна перестановка.
источник

V

Viktor in catboost_ru
а есть где-то примеры применения к гиперпараметрам как гридсерча так и рендомсерча?
источник

AD

Anna Veronika Dorogush in catboost_ru
источник

AD

Anna Veronika Dorogush in catboost_ru
Но надо бы сделать отдельный туториал на питоне с подбором параметров https://github.com/catboost/catboost/issues/782 - сделала issue
источник

SZ

Sasha Zhu in catboost_ru
Anna Veronika Dorogush
Но надо бы сделать отдельный туториал на питоне с подбором параметров https://github.com/catboost/catboost/issues/782 - сделала issue
Ой, было бы очень здорово
источник

G

Grigory in catboost_ru
Anna Veronika Dorogush
Но надо бы сделать отдельный туториал на питоне с подбором параметров https://github.com/catboost/catboost/issues/782 - сделала issue
👍🏻
источник

AD

Anna Veronika Dorogush in catboost_ru
Сегодня мы опубликовали новый релиз библиотеки 0.14.0!
В этом релизе сильно ускорено обучение CPU на разреженных данных, добавлены новые стратегии построения деревьев (теперь поддержаны стратегии из XGBoost и LightGBM) и возможность выбора скора для сплитов на GPU. Эти два новых параметра могут улучшить качество итоговой модели, если их подбирать. Есть и другие улучшения - о них можно почитать здесь.
Подробности на гитхабе: https://github.com/catboost/catboost/releases/tag/v0.14.0
источник

А

Андрей in catboost_ru
Вааау, очень вовремя!!
источник

А

Андрей in catboost_ru
спасибо
источник

K

K-S in catboost_ru
Надо на сантандере затестить
источник

NB

Nick Bush in catboost_ru
Google TPU планируется поддерживать? Или он только для нейросетей подходит?
источник

AD

Anna Veronika Dorogush in catboost_ru
Nick Bush
Google TPU планируется поддерживать? Или он только для нейросетей подходит?
Теоретически можно было бы и на нем обучаться, но мы не планируем поддерживать.
источник
2019 April 10

IP

Igor Petrov in catboost_ru
На презентациях видел сколько нужно памяти под определенный тип фичи. Если ли где-то в виде таблице эти данные?
источник