Size: a a a

2019 September 26

P

Polosataya in catboost_ru
Ой зря сказала
источник
2019 September 27

ДМ

Даниил Московский in catboost_ru
Привет, подскажите, есть ли в catboost возможность считать регрессионные метрики (MAE, MAPE) не по всему датасету, а усреднением по группам, заданным в Pool в поле group_id?
источник

P🐈

Pavel Tyavin 🐈 in catboost_ru
Даниил Московский
Привет, подскажите, есть ли в catboost возможность считать регрессионные метрики (MAE, MAPE) не по всему датасету, а усреднением по группам, заданным в Pool в поле group_id?
Можно дописать UserQuerywiseMetric и в ней что угодно сделать
источник

P🐈

Pavel Tyavin 🐈 in catboost_ru
Я так делал RMSE-like метрику , которая одновременно штрафует и группу и отдельные примеры
источник

P🐈

Pavel Tyavin 🐈 in catboost_ru
источник

SK

Stanislav Kirillov in catboost_ru
Можно потом еще послать нам эту метрику в ПР:)
источник

ДМ

Даниил Московский in catboost_ru
Pavel Tyavin 🐈
Можно дописать UserQuerywiseMetric и в ней что угодно сделать
Спасибо, а есть пример с реализованными кастомными метриками на python?
источник

P🐈

Pavel Tyavin 🐈 in catboost_ru
Даниил Московский
Спасибо, а есть пример с реализованными кастомными метриками на python?
Групповые на питоне нельзя писать (
источник

ДМ

Даниил Московский in catboost_ru
Ох, а на плюсах есть пример? Желательно, с описанием пересборки catboost)
источник

P🐈

Pavel Tyavin 🐈 in catboost_ru
К сожалению это все сложно, лучше попробовать для начала собрать кэтбуст без изменений.

Беда еще в том, что UserQuerywiseMetric нужно править только в самом кэтбусте.
Интерфейса, где ты используешь кэтбуст как библиотеку, нет
источник

P🐈

Pavel Tyavin 🐈 in catboost_ru
Если дойдут руки до создания этой метрики, то править нужно два файла - metric.cpp и error_functions.h . Вот пример метрики
https://gist.github.com/paveltyavin/3e279f6010ba38356541ada174d04e4d
источник
2019 September 28

P

Polosataya in catboost_ru
Здравствуйте. Я обучаю модель через train. Она занимает 2,7 гига оперативки. В конце обучения пишет bestTest, bestIteration, Shrink model и потом начинает заполнять всю оперативную память и часть свопа. После этого predict сделать уже не получается, т.к. ждет осовбождения памяти. gc освобождает 0. Подскажите, от чего это?
источник
2019 September 30

SN

Sergej Novik in catboost_ru
Не могу понять, как использовать параметр has_time. Где надо указывать, какая колонка должна использоваться?
источник

OS

Oleg Shapovalov in catboost_ru
Насколько я понял, просто надо отсортировать датасет в нужном порядке. У меня так работало
источник

AA

Artem Andrienko in catboost_ru
О, кстати, это интересный параметр
Оптимизировал catboost на временных рядах через hyperopt, оказалось, что has_time=False даёт лучший скор, но вообще разница незначительная
Это возможное поведение или я что-то неправильно делал?
источник

SN

Sergej Novik in catboost_ru
Oleg Shapovalov
Насколько я понял, просто надо отсортировать датасет в нужном порядке. У меня так работало
👍 Ок, попробую
источник
2019 October 01

AD

Anna Veronika Dorogush in catboost_ru
В одном из предыдущих релизов мы поддержали разреженные данные. Поделитесь впечатлениями, кто использует. Был ли этот релиз вам полезен? Для чего используете?
источник

Аa

Андрей amber4eg in catboost_ru
Anna Veronika Dorogush
В одном из предыдущих релизов мы поддержали разреженные данные. Поделитесь впечатлениями, кто использует. Был ли этот релиз вам полезен? Для чего используете?
Обрадовался, попытался использовать для классификации текста, сделал bag of word через tfidf, скормил кэтбусту, увидел estimated time: 21h, закрыл, открыл issue. Сижу расстраиваюсь.
источник

V

Viktor in catboost_ru
Андрей amber4eg
Обрадовался, попытался использовать для классификации текста, сделал bag of word через tfidf, скормил кэтбусту, увидел estimated time: 21h, закрыл, открыл issue. Сижу расстраиваюсь.
сравните тогда и с другими моделями плз - интересно как оно
источник

Аa

Андрей amber4eg in catboost_ru
Viktor
сравните тогда и с другими моделями плз - интересно как оно
SGDClassifier моментально считает (секунды)
источник