Size: a a a

2019 March 06

Аa

Андрей amber4eg in catboost_ru
А модельки, обученный на 0.11, загруженные в 0.10.3, тоже работают. И это не вопрос, они правда работают.
источник

AD

Anna Veronika Dorogush in catboost_ru
Anna Veronika Dorogush
да, гарантируется обратная совместимость
Так, про обратную совместимость, если у тебя бинарник новый, то старая модель будет работать. Это мы гарантируем, наоборот нет, но между этими версиями должно работать, да.
источник

Аa

Андрей amber4eg in catboost_ru
угу, я понял. Просто работа модельки от 0.11 с бинарником 0.10 оказалась приятным сюрпризом и я решил им тоже поделиться
источник

IF

Ivan Filonov in catboost_ru
я ведь правильно понимаю, что категориальные признаки при передаче в CatBoostClassifier сначала предобрабатываются в 1 поток сколько бы не было указано в thread_count?
источник

VE

Vasily Ershov in catboost_ru
Ivan Filonov
я ведь правильно понимаю, что категориальные признаки при передаче в CatBoostClassifier сначала предобрабатываются в 1 поток сколько бы не было указано в thread_count?
нет, они могут обрабатываться параллельно (зависит от их числа)
источник

IF

Ivan Filonov in catboost_ru
5кк строк, где-то 200 категории, 700 числовые - на нескольких машинах уже порядка часа минимум занято только 1 ядро
источник

IF

Ivan Filonov in catboost_ru
пока единственное подозрение - чисто последовательная предобработка
источник

SK

Stanislav Kirillov in catboost_ru
а в каком формате данные?
источник

SK

Stanislav Kirillov in catboost_ru
если это list of list то может быть очень долго
источник

SK

Stanislav Kirillov in catboost_ru
лучше загружать такие данные в catboost.Pool прямо из файла
источник

SK

Stanislav Kirillov in catboost_ru
иначе нам GIL не дает делать параллельный в кастинг строк из питона в с++
источник

IF

Ivan Filonov in catboost_ru
pandas dataframe, строк нет - 208 uint8 709 float32
источник

SK

Stanislav Kirillov in catboost_ru
источник

IF

Ivan Filonov in catboost_ru
о, спасибо, пока закостылю в int32 какой-нибудь
источник

SK

Stanislav Kirillov in catboost_ru
заведи issue, пожалуйста, чтобы мы не забыли
источник

SK

Stanislav Kirillov in catboost_ru
int8 + int16
источник

IF

Ivan Filonov in catboost_ru
https://github.com/catboost/catboost/issues/718 несколько не по феншую, но как напоминалка должно сойти
источник

SK

Stanislav Kirillov in catboost_ru
👍
источник

IF

Ivan Filonov in catboost_ru
с int32 действительно до начала собственно обучения дошло гораздо быстрее
источник

SK

Stanislav Kirillov in catboost_ru
сколько примерно заняло?
источник