Size: a a a

2019 March 11

FF

Frank F in catboost_ru
Maxim Khrisanfov
какие тонкости ты имеешь ввиду?
Реализация на gpu, выравнивание классов, число фолдов и прочее. Уверен что программисты яндекса не зря едят свой хлеб, поэтому сэкономили наше время и сделали Хороший продукт почти без танцев с бубном
источник

PC

Pika Chu in catboost_ru
Frank F
А что разве можно сохранять модели из кросс-валидации ?
Catboost.cv не умеет, но вообще этого никто не запрещает. Посмотри в sklearn.
источник

FF

Frank F in catboost_ru
Pika Chu
Catboost.cv не умеет, но вообще этого никто не запрещает. Посмотри в sklearn.
Вопрос насколько это нужно? ведь модели будут примерно близки по качеству. Полпроцента точности погоду не сделают
источник

PC

Pika Chu in catboost_ru
Frank F
Вопрос насколько это нужно? ведь модели будут примерно близки по качеству. Полпроцента точности погоду не сделают
Здесь не мне решать.
источник

AD

Anna Veronika Dorogush in catboost_ru
Pika Chu
Catboost.cv не умеет, но вообще этого никто не запрещает. Посмотри в sklearn.
catboost.cv делает кросс-валидацию и не делает подбор параметров. Не нужно путать эту функцию с методами подбора параметров, в которых можно получить лучшую модель. Дело не в том, что функциональность подбора параметров в этой функции не поддержана или еще не поддержана, просто это другая функция.
источник

PC

Pika Chu in catboost_ru
Anna Veronika Dorogush
catboost.cv делает кросс-валидацию и не делает подбор параметров. Не нужно путать эту функцию с методами подбора параметров, в которых можно получить лучшую модель. Дело не в том, что функциональность подбора параметров в этой функции не поддержана или еще не поддержана, просто это другая функция.
Нет-нет. Насколько я понимаю там речь о том, какую реализацию весов, структуру деревьев, разбиейний, etc выбрать.

Конечно, было бы неплохо переимновать cv в cross_val_score для пущей совместимости с sklearn.
источник

AD

Anna Veronika Dorogush in catboost_ru
так ты не сможешь выбрать из функции кросс-валидации ни веса, ни параметры для структуры деревьев.
источник

AD

Anna Veronika Dorogush in catboost_ru
имя cv - это для совместимости с xgboost
источник

PC

Pika Chu in catboost_ru
Anna Veronika Dorogush
имя cv - это для совместимости с xgboost
А, вот как. Неожиданно.
источник

PC

Pika Chu in catboost_ru
Да, не cможешь. Думал, что речь идёт о cv вообще, а не в контексте catboost.
источник
2019 March 12

A

Andrey in catboost_ru
Пользуясь случаем - я тут добавил поддержку catboost в https://github.com/statist-bhfz/grideR Модели при кросс-валидации не сохраняются, зато опционально сохраняются предикты на проверочных данных. Стекинг на этой основе тоже скоро будет готов
источник

FF

Frank F in catboost_ru
Anna Veronika Dorogush
catboost.cv делает кросс-валидацию и не делает подбор параметров. Не нужно путать эту функцию с методами подбора параметров, в которых можно получить лучшую модель. Дело не в том, что функциональность подбора параметров в этой функции не поддержана или еще не поддержана, просто это другая функция.
Вот я так и понял. Что мы просто строим несколько тестовых моделей в кроссвалидации и смотрим устойчивость метрики. Если все ок, то наша исходно-созданная Модель хорошая и можно ее использовать. Если метрика сильно изменчива на разных Фолдах, то Модель плохая, я верно вас понял?
источник

Аa

Андрей amber4eg in catboost_ru
Может ли использование модели от 0.11 с бинарником 0.12 приводить к падению производительности?
источник

AD

Anna Veronika Dorogush in catboost_ru
нет
источник
2019 March 13

OO

Oleg Okeev in catboost_ru
Началось )))
источник

SB

Sergey Brazhnik in catboost_ru
Oleg Okeev
Началось )))
Ну нет 🙂
источник

SZ

Sasha Zhu in catboost_ru
Ребята, а расскажите,  как можно делать under/oversampling с использвоанием Catboost'a?
источник

AD

Anna Veronika Dorogush in catboost_ru
Можно сделать предобработку датасета, можно веса использовать.
источник

SB

Sergey Brazhnik in catboost_ru
В Slack чате Open Data Science у CatBoost появился свой канал #tool_catboost. Вступить в чат можно по ссылке, если еще нет, http://ods.ai
источник

SZ

Sasha Zhu in catboost_ru
Anna Veronika Dorogush
Можно сделать предобработку датасета, можно веса использовать.
Справляюсь более-менее весами, спасибо! А под предобработкой данных что именно имеется ввиду? Я пыталась сделать в связке с imblearn, но начались проблемы с категориальными данными. Вот пытаюсь понять, есть ли что-то подобное из коробки
источник