Size: a a a

2019 March 19

MK

Maxim Khrisanfov in catboost_ru
Anna Veronika Dorogush
можно датасет себе взять для тестов будущих?
а какие датасеты вам еще нужны? у меня есть много по мультиклассу
источник

VE

Vasily Ershov in catboost_ru
мультикласс очень нужен
источник

MK

Maxim Khrisanfov in catboost_ru
Vasily Ershov
мультикласс очень нужен
ok, после отпуска вышлю вам несколько
источник

KM

Kirill Moysa in catboost_ru
На CPU = 20.9s
источник

KM

Kirill Moysa in catboost_ru
На GPU = 1 min 13s
источник

KM

Kirill Moysa in catboost_ru
Наврал, 20.9s это на моем i5. А на процессоре, который на сервере 17 секунд. Видеокарта тоже на сервере. Все крутиться в докере
источник

A

Andrey in catboost_ru
Kirill Moysa
Наврал, 20.9s это на моем i5. А на процессоре, который на сервере 17 секунд. Видеокарта тоже на сервере. Все крутиться в докере
Попробуй без докера
источник

A

Andrey in catboost_ru
Не замерял, но интуитивно кажется, что там есть дополнительный оверхед
источник

KM

Kirill Moysa in catboost_ru
Andrey
Попробуй без докера
Мне сис-админ не даст "засорять" сервер)
источник

A

Andrey in catboost_ru
Чуть позже погоняю из-под R. Есть возможность сравнить i5 vs 1060 и 2670v2 vs 1070
источник

A

Andrey in catboost_ru
У меня пока что gpu всегда быстрее
источник

VE

Vasily Ershov in catboost_ru
на том датасете так примерно и будет, там 1) Кат фичи 2) Ordered бустинг  и очень маленький датасет
каждая из этих фичей увеличивает размер датасета, с которого GPU выгодно использовать. При неочень большом числе кат-фичей обычно это от ≈30к, без кат-фичей где-то от 15к, но сильно зависит от используемого CPU
источник
2019 March 21

KM

Kirill Moysa in catboost_ru
Всем доброго утра. Возник вопрос. Я тренирую модель, сохраняю, а затем загружаю ее в другом py файле. Самое интересное, что результат разный при вызове метода predict(). Почему?
источник

SK

Stanislav Kirillov in catboost_ru
ты делаешь пикл или save_model?
источник

KM

Kirill Moysa in catboost_ru
save_model
источник

SK

Stanislav Kirillov in catboost_ru
а в каком формате данные в предикт передаешь?
источник

KM

Kirill Moysa in catboost_ru
numpy array
источник

SK

Stanislav Kirillov in catboost_ru
и какой тип используешь - сырые значени, вероятности или классы
источник

SK

Stanislav Kirillov in catboost_ru
Будет здорово, если сделаешь микро пример-репрезентатор и сделаешь issue на гитхабе
источник

KM

Kirill Moysa in catboost_ru
источник