Size: a a a

2021 April 05

TB

Taras B in catboost_ru
числовые, cat_features и 3 embedding_features
источник

AI

Aleksey Ivanov in catboost_ru
Есть здесь есть кто из яндекса?

https://catboost.ai/docs/ глючит. Говорит 404 и "Domain matching for cluster not found"
источник

IL

Ivan Lyzhin in catboost_ru
Aleksey Ivanov
Есть здесь есть кто из яндекса?

https://catboost.ai/docs/ глючит. Говорит 404 и "Domain matching for cluster not found"
Видели - разбираемся.
источник

SK

Stanislav Kirillov in catboost_ru
Откатили, работает
источник
2021 April 06

DD

Dmitry Dmitriev in catboost_ru
Всем привет. 0.25 даёт сильно хуже результат чем 0.23 на одном и том же датасете. В чем может быть дело? Может какие-то параметры можно поменять или лучше не трогать и сидеть на 0.23?
источник

ND

Nikita Dmitriev in catboost_ru
Dmitry Dmitriev
Всем привет. 0.25 даёт сильно хуже результат чем 0.23 на одном и том же датасете. В чем может быть дело? Может какие-то параметры можно поменять или лучше не трогать и сидеть на 0.23?
Привет!
А какой у тебя лосс?
источник

DD

Dmitry Dmitriev in catboost_ru
Nikita Dmitriev
Привет!
А какой у тебя лосс?
Я его не трогал, полагаю в обоих случаях тот, который в регрессоре по дефолту.
источник

SK

Stanislav Kirillov in catboost_ru
GPU?
источник

DD

Dmitry Dmitriev in catboost_ru
Да
источник

II

Ilia Iagupov in catboost_ru
Andrew Kolesnichenko
я нашел ишью по этой проблеме https://github.com/catboost/catboost/issues/892
он закрыт, но проблема на самом деле есть. я оставил коммент там с примером
если проверять память после тысяч итераций, то это заметно
Я так понимаю, что эта проблема делает невозможным использовать catboost для realtime предсказаний - рано или поздно все упадет из-за памяти
Добрый день, кто-нибудь знает, есть ли какие-то продвижения по этой проблеме (она числится как закрытая почему-то)?
источник

SK

Stanislav Kirillov in catboost_ru
Ilia Iagupov
Добрый день, кто-нибудь знает, есть ли какие-то продвижения по этой проблеме (она числится как закрытая почему-то)?
Привет! Я запускал код и у меня не воспроизвелось почему-то:(
источник

SK

Stanislav Kirillov in catboost_ru
Давай еще раз попробуем
источник

II

Ilia Iagupov in catboost_ru
Сейчас тоже ещё раз попробую запустить на последней версии катбуста.
источник

II

Ilia Iagupov in catboost_ru
я, наверное, где-то ошибаюсь, но я запустил этот код:
https://github.com/catboost/catboost/issues/892#issuecomment-778603068

сразу после
while True:
   list_for_pool = [random() for i in range(size)]
   p = Pool(list_for_pool, label=None, thread_count=1)
я добавил
   del p
   del list_for_pool
чтобы удалить переменные из памяти.
и всё равно на каждой итерации память растёт.

python version= 3.9.4 (tags/v3.9.4:1f2e308, Apr  4 2021, 13:27:16) [MSC v.1928 64 bit (AMD64)]
catboost version= 0.25.1
Time elapsed: 30s Iterations: 12711 Mem Change: 3.39 MB
Time elapsed: 60s Iterations: 25474 Mem Change: 4.80 MB
Time elapsed: 90s Iterations: 38095 Mem Change: 5.93 MB
Time elapsed: 120s Iterations: 50822 Mem Change: 7.15 MB
Time elapsed: 150s Iterations: 63516 Mem Change: 8.69 MB
Time elapsed: 180s Iterations: 76249 Mem Change: 9.84 MB
Time elapsed: 210s Iterations: 88962 Mem Change: 11.09 MB

В чём может быть ошибка? :(
источник

SK

Stanislav Kirillov in catboost_ru
А если руками дергать gc.collect() ?
источник

II

Ilia Iagupov in catboost_ru
поместил gc.collect() сразу после двух del, потребляемая память всё равно растёт :(
операционная система: windows 10,
python version= 3.9.4 (tags/v3.9.4:1f2e308, Apr  4 2021, 13:27:16) [MSC v.1928 64 bit (AMD64)]
catboost version= 0.25.1
Time elapsed: 30s Iterations: 2502 Mem Change: 1.65 MB
Time elapsed: 60s Iterations: 5048 Mem Change: 1.98 MB
Time elapsed: 90s Iterations: 7588 Mem Change: 2.33 MB
Time elapsed: 120s Iterations: 10146 Mem Change: 2.73 MB
Time elapsed: 150s Iterations: 12683 Mem Change: 3.24 MB
Time elapsed: 180s Iterations: 15248 Mem Change: 3.60 MB
Time elapsed: 210s Iterations: 17753 Mem Change: 3.83 MB
Time elapsed: 240s Iterations: 20311 Mem Change: 4.08 MB
Time elapsed: 270s Iterations: 22848 Mem Change: 4.30 MB
Time elapsed: 300s Iterations: 25403 Mem Change: 4.59 MB
источник

SK

Stanislav Kirillov in catboost_ru
Ааа, windows, я на Линукс тестировал
источник

II

Ilia Iagupov in catboost_ru
извиняюсь, не написал сразу)
источник

AK

Andrew Kolesnichenko in catboost_ru
там в моем комменте на гитхабе скрипт на линуксе бежал.
но в конечном итоге я все переписал на плюсы)
можно попробовать в докере запустить с новой версией 0.25.1, чтобы точно можно было воспроизвести
источник

M

Max in catboost_ru
Всем привет!
В чате как-то читал, что планируется сделать решение для прогнозирования временных рядов, подскажите, планы не поменялись? Если нет, то что по срокам?)
источник