Size: a a a

2019 February 19

OT

Oscar Tempter in catboost_ru
а катбуст до сих пор не поддерживает разреженные матрицы?
источник

AK

Andrei Khropov in catboost_ru
Привет! Пока нет, но работа над этим началась.
источник
2019 February 20

MK

Maxim Khrisanfov in catboost_ru
Всем привет, заметил что predict_proba (возможно и predict) кушает много памяти.
Например, запускаю predict_proba на датасете из 3 миллиона наблюдейний, на момент запуска 6Gb оперативной памяти занято из 32Gb.
Во время работы всех потоков процессора память не растет, потом начинает работать один поток и занимаемый объем памяти резко растет до 32gb чуть-чуть залезая в swap, после завершения работы занятый объем резко падает до 9Gb. Получается, что сами предикшены занимают около 3Gb, тогда зачем ему дополнительный 21Gb? Если добавлять больше наблюдений то уже будет глубоко залезать в swap, что не очень хорошо. Это правильная работа или какой-то баг?
источник

SK

Stanislav Kirillov in catboost_ru
Привет
источник

SK

Stanislav Kirillov in catboost_ru
А у тебя данные с катфичами?
источник

MK

Maxim Khrisanfov in catboost_ru
да
источник

SK

Stanislav Kirillov in catboost_ru
а сколько float/categ фичей в штуках если не секрет?
источник

SK

Stanislav Kirillov in catboost_ru
возможно, придется делать для такого случая интернирование строк при переходе python->c++
источник

MK

Maxim Khrisanfov in catboost_ru
всего 26 фичей из них 3 категориальные
источник

MK

Maxim Khrisanfov in catboost_ru
в predict_proba передаю Pool
источник

SK

Stanislav Kirillov in catboost_ru
а
источник

SK

Stanislav Kirillov in catboost_ru
тогда тут не должно быть преобразования
источник

MK

Maxim Khrisanfov in catboost_ru
и с пандас и с пулом одинаковая ситуация
источник

MK

Maxim Khrisanfov in catboost_ru
сам же предикт многопоточный? когда много потоков там запущено память не растет, видимо начинает уже расти после предикта, какая то там операция после начинает кушать память
источник

SK

Stanislav Kirillov in catboost_ru
так)
источник

SK

Stanislav Kirillov in catboost_ru
у нас тут валенок на пульте кажется)
источник

MK

Maxim Khrisanfov in catboost_ru
я что ли?)
источник

MK

Maxim Khrisanfov in catboost_ru
я могу записать видео вывода htop
источник

SK

Stanislav Kirillov in catboost_ru
источник

SK

Stanislav Kirillov in catboost_ru
надо тут пофиксить, создавать np.array вместо питонячьего массива
источник