Size: a a a

2019 June 03

SK

Stanislav Kirillov in catboost_ru
Andrey Stroganov
если будет возможность, поделитесь тестовыми метриками? меня очень интересует прирост скорости evaluation, который скорее всего будет значительным изза более плотного использования кеша памяти
прироста не будет же
источник

SK

Stanislav Kirillov in catboost_ru
только экономия памяти при использовании одной модели в разных процессах
источник

AS

Andrey Stroganov in catboost_ru
Stanislav Kirillov
прироста не будет же
если сделать формат заточенный под максимально линейное и последовательное обращение к памяти — то будет афигенный. Это как merge sort & quick sort — вроде оба N*log(N), но на современных процессорах merge может быть в несколько раз быстрее, ибо последовательное обращение к памяти.
источник

SK

Stanislav Kirillov in catboost_ru
ты наверно имеешь в виду экономию на TLB и HUGE PAGE
источник

SK

Stanislav Kirillov in catboost_ru
прям сейчас алгоритм и так бежит по векторам максимально линейно
источник

VE

Vasily Ershov in catboost_ru
Andrey Stroganov
если сделать формат заточенный под максимально линейное и последовательное обращение к памяти — то будет афигенный. Это как merge sort & quick sort — вроде оба N*log(N), но на современных процессорах merge может быть в несколько раз быстрее, ибо последовательное обращение к памяти.
формат применялки уже заточен под эфективное обращение к памяти
источник

SK

Stanislav Kirillov in catboost_ru
самая большая проблема - это фетч значений листьев, там идет gather по фиксированному смещению + номер листа документа
источник
2019 June 04

MK

Maxim Khrisanfov in catboost_ru
вызов функции get_object_importance съедает всю оперативку, больше 30 гигабайт и залезает в своп, дальше не стал проверять, так и должно быть? передаю pool=25k строк и train_pool=75k строк
источник

SB

Sergey Birkun in catboost_ru
Привет, маловероятно, но вдруг: возможно ли указать для регрессии что все тагеты больше нуля?
источник

A

Aнтон in catboost_ru
Sergey Birkun
Привет, маловероятно, но вдруг: возможно ли указать для регрессии что все тагеты больше нуля?
Не подойдёт ли под логарифм его загнать предварительно, а получив прогноз - прогноз под экспоненту? 🙃
источник

A

Aнтон in catboost_ru
Хотя это может быть не лучше чем просто "обнулять" отрицательные прогнозы, в зависимости от области определения таргета
источник

SB

Sergey Birkun in catboost_ru
@rubyr0id да, может быть не лучшим, но попробую. Спасибо
источник
2019 June 06

DB

Dmitry Barychev in catboost_ru
Всем привет! Меня зовут Дмитрий Барычев, руководитель сервиса Отследить-посылку.рф . Мы строим можель в катбусте по прогнозу, выкупит или нет человек следующую посылку, отправленную Почтой России наложенным платежом. У нас в базе 200 млн посылок и 1 млрд писем. Модель построили в катбусте, но пока результат не очень. Ищу специалиста, кто может выделять час времени в день, чтобы нам помогать или взять в работу весь проект. Отзовитесь, пожалуйста! Очень надо. Нам срочно. Отблагодарим щедро!)
источник

A

Andrey in catboost_ru
Что значит "не очень"? Почему сразу катбуст, что с другими алгоритмами?
источник

DB

Dmitry Barychev in catboost_ru
кликхаус
источник

DB

Dmitry Barychev in catboost_ru
не очень - 79% точности
источник

DB

Dmitry Barychev in catboost_ru
хочется 95
источник

A

Andrey in catboost_ru
Уже почти все понятно. Какая доля посылок "выкупается"?
источник

DB

Dmitry Barychev in catboost_ru
85 в среднем, но разброс от 55 до 95
источник

A

Andrey in catboost_ru
Тогда точность 85 получается вообще без моделей
источник