Size: a a a

2018 December 25

AD

Anna Veronika Dorogush in catboost_ru
Сейчас не должен быть намного медленнее. От данных зависит, где-то медленнее, где-то быстрее. Это про цпу, на гпу должно быть всегда быстрее. Если это не так, скинь данные посмотреть.
источник

AD

Anna Veronika Dorogush in catboost_ru
Да, pip install все ставит
источник

AD

Anna Veronika Dorogush in catboost_ru
Проверь версию, что у тебя новая.
источник

P

Polosataya in catboost_ru
Anna Veronika Dorogush
Сейчас не должен быть намного медленнее. От данных зависит, где-то медленнее, где-то быстрее. Это про цпу, на гпу должно быть всегда быстрее. Если это не так, скинь данные посмотреть.
спасибо, а как проверить версию?
источник

ND

Nikita Dmitriev in catboost_ru
Например
import catboost
print(catboost.__version__)
источник

P

Polosataya in catboost_ru
Версия 0.11.2. Данные (6261 на 14). Кроссвалидация с GPU, xgb 1 секунда, cat 58 секунд. Так и должно быть, или у меня что-то не то?
источник

Аa

Андрей amber4eg in catboost_ru
У тебя что-то не то. И, вероятно, с данными
источник

AD

Anna Veronika Dorogush in catboost_ru
Кросс-валидация на гпу в катбусте только в новом релизе будет. Уже есть на гитхабе. Или ты руками запускала? Вообще гпу полезен начиная где-то с 10 тысяч объектов, и дальше чем больше объектов, тем лучше. Но не может быть, чтобы в 60 раз был медленнее катбуст на гпу.
источник

Аa

Андрей amber4eg in catboost_ru
GPU на таких размерах, кстати, вообще не стоит трогать. ИМХО больше накладных расходов, чем пользы
источник

Аa

Андрей amber4eg in catboost_ru
а какие настройки early_stopping у обоих?
источник

P

Polosataya in catboost_ru
Кросс валидацию в cross_val_score считаю. Это уже вторая задача, где я разобраться не могу с кэтбустом
источник

VE

Vasily Ershov in catboost_ru
на таком датасете:
1) ordered/dynamic-бустинг на таких объемах данных (для качества в ущерб скорости)
2) если классификация, то доп. алгоритм оценки листьев
поэтому катбуст может быть медленей других бустингов, только из-за различий в алгоритме

но вообще если учесть еще и кросс-валидацию, то на таком датасете хороший CPU скорее всего будет быстрее, чем GPU
источник

P

Polosataya in catboost_ru
Андрей amber4eg
GPU на таких размерах, кстати, вообще не стоит трогать. ИМХО больше накладных расходов, чем пользы
early_stopping вообще не трогала. Пробую понять, что не так вообще
источник

VE

Vasily Ershov in catboost_ru
Андрей amber4eg
GPU на таких размерах, кстати, вообще не стоит трогать. ИМХО больше накладных расходов, чем пользы
для таких размерах GPU выгоден только если сразу обучать много разных моделей в один проход  (например, сразу на большом сетке параметров)
Но мы такую функциональность для катбуста не делали
источник

P

Polosataya in catboost_ru
Я гипероптом параметры подбираю, хотела время сократить
источник

P

Polosataya in catboost_ru
Спасибо, тогда без гпу буду считать
источник

AD

Anna Veronika Dorogush in catboost_ru
Мы скорость гпу на датасетах такого размера не сравнивали с другими библиотеками. Надо добавить в бенчмарки, обязательно это сделаем, большое спасибо за фидбек. Правда я все-таки не уверена, что может быть такая разница. Может, глубину ты разную всем ставишь или число итераций? Скинь мне в личку код и если не жалко, то датасет тоже.
источник

DB

Dmitry Buslov in catboost_ru
Vasily Ershov
для таких размерах GPU выгоден только если сразу обучать много разных моделей в один проход  (например, сразу на большом сетке параметров)
Но мы такую функциональность для катбуста не делали
Приветствую. А есть в планах?
источник

AD

Anna Veronika Dorogush in catboost_ru
Пока нет, заводи issue, если нужна.
источник

DB

Dmitry Buslov in catboost_ru
источник