Size: a a a

2020 February 20

SK

Stanislav Kirillov in catboost_ru
Идентификаторы групп используются при подсчете функций ошибки и производных для ранжирующих таргетов (https://catboost.ai/docs/concepts/loss-functions-ranking.html)
источник
2020 February 21

AG

Andrew Grigorev in catboost_ru
Andrew Grigorev
Всем привет! Одна и та же моделька под Mac os отрабатывает за 0.7мс, а в docker'е >10мс. Catboost ставится через pip install. Куда смотреть? Есть смысл собрать из исходников с оптимизациями? Заводить ли баг на кривую сборку в pypi?
источник

AG

Andrew Grigorev in catboost_ru
Короче проблема похоже в какой-то синхронизации в потоках.
источник

AG

Andrew Grigorev in catboost_ru
Копаю дальше...
источник

SK

Stanislav Kirillov in catboost_ru
Привет
источник

SK

Stanislav Kirillov in catboost_ru
Обязательно посмотрим
источник

SK

Stanislav Kirillov in catboost_ru
На ирисе и 1с это много
источник

AD

Anna Veronika Dorogush in catboost_ru
На ирисе всегда в один поток должно считаться все, видимо пытаемся распараллелить, поэтому замедление. Ирис такой маленький, что на нем в 1 поток быстрее. Посмотрим, отпишемся в issue
источник

PB

Pavel Baidaus in catboost_ru
Всем привет! Практический вопрос от начинающего возможно глупый - пре интро : тюнил гипер параметры catboosta на тестовой выборке (сабмишн) дошел до своего лучшего результата изменения гиперпараметров ни в в какую сторону не давали прироста, потом резко увеличил количество фичей в 3 раза результат еще немного улучшился. Теперь вопрос поможет ли увеличение числа деревьев или глубина или др параметров, при увеличении числа признаков? ПыСЫ вопрос задаю так как расчеты длительные для экспериментов может кто сталкивался
источник

ИБ

Иван Брагин in catboost_ru
> на тестовой выборке (сабмишн)
тюнить лучше не на тестовой выборке а на кросс валидации. Есть встроенная cv.
>  поможет ли увеличение числа деревьев или глубина
поменял признаки, параметры лучше искать заново, но вероятно близко к тем значениям которые получились ранее
источник

PB

Pavel Baidaus in catboost_ru
пасиб
источник

B

Baldy in catboost_ru
Кто-то добивался успеха в Forecast с катбустом? Интересует обычная ARIMA
источник

U

Usurper in catboost_ru
Здравствуйте. Можно ли сохранить обученную модель, загрузить ее и дообучить на одном новом примере?
источник

AG

Andrew Grigorev in catboost_ru
Anna Veronika Dorogush
На ирисе всегда в один поток должно считаться все, видимо пытаемся распараллелить, поэтому замедление. Ирис такой маленький, что на нем в 1 поток быстрее. Посмотрим, отпишемся в issue
Продакшн задачка у нас помощнее чем iris, но симптомы такие же, на макбуке и ноуте с линуксом .5мс предикт, а на сервере - 10+ :).
источник

AG

Andrew Grigorev in catboost_ru
Ещё у меня есть фичереквест, посчитать на одних и тех же фичах пару десятков моделек, вероятно в потоках, но за один вызов catboost из питона. Вообще нам просто multi-label классификатор нужен, есть идеи как его без костылей получить?.. Сейчас ребята наварили модельку, которой в отдельной категориальной фиче передается для какого класса выдавать вероятность. То есть делается батч из N одинаковых записей, отличающихся только одной фичей.
источник
2020 February 23

AG

Andrew Grigorev in catboost_ru
Anna Veronika Dorogush
На ирисе всегда в один поток должно считаться все, видимо пытаемся распараллелить, поэтому замедление. Ирис такой маленький, что на нем в 1 поток быстрее. Посмотрим, отпишемся в issue
под 0.18.1 работает нормально
источник