Телеграмм чат группы catboost_ru страница 130

parrot.ru

Рейтинг популярных групп и каналов

В рейтинге участвует:

групп:

каналов:

Виртуальный сервер на SSD - недорого!

Аренда выделенных и виртуальных серверов (VDS/VPS), хостинг, аренда IP-адресов, администрирование, круглосуточная поддержка

qwarta.ru подробнее

Резервное копирование с проверкой на вирусы!!!

Удобный сервис создания резервных копий на любой сервер сети интернет. Отслеживайте изменения, проверяйте на вирусы. Надежно защитите свой бизнес!

go.backupland.com

Выбираете сервер? Любая конфигурация на заказ!

Аренда физических серверов любых конфигураций под любые запросы - 1С бухгалтерия, игровые сервера, нагруженные проекты, интернет-магазины!

qwarta.ru подробнее

Size: a a a

catboost_ru

553 membersпожаловаться на группу

2019 June 03

SK

Stanislav Kirillov in catboost_ru

Andrey Stroganov

если будет возможность, поделитесь тестовыми метриками? меня очень интересует прирост скорости evaluation, который скорее всего будет значительным изза более плотного использования кеша памяти

прироста не будет же

источник

19:09пожаловаться #1

SK

Stanislav Kirillov in catboost_ru

только экономия памяти при использовании одной модели в разных процессах

источник

19:09пожаловаться #2

AS

Andrey Stroganov in catboost_ru

Stanislav Kirillov

прироста не будет же

если сделать формат заточенный под максимально линейное и последовательное обращение к памяти — то будет афигенный. Это как merge sort & quick sort — вроде оба N*log(N), но на современных процессорах merge может быть в несколько раз быстрее, ибо последовательное обращение к памяти.

источник

19:11пожаловаться #3

SK

Stanislav Kirillov in catboost_ru

ты наверно имеешь в виду экономию на TLB и HUGE PAGE

источник

19:13пожаловаться #4

SK

Stanislav Kirillov in catboost_ru

прям сейчас алгоритм и так бежит по векторам максимально линейно

источник

19:14пожаловаться #5

VE

Vasily Ershov in catboost_ru

Andrey Stroganov

если сделать формат заточенный под максимально линейное и последовательное обращение к памяти — то будет афигенный. Это как merge sort & quick sort — вроде оба N*log(N), но на современных процессорах merge может быть в несколько раз быстрее, ибо последовательное обращение к памяти.

формат применялки уже заточен под эфективное обращение к памяти

источник

19:14пожаловаться #6

SK

Stanislav Kirillov in catboost_ru

самая большая проблема - это фетч значений листьев, там идет gather по фиксированному смещению + номер листа документа

источник

19:14пожаловаться #7

2019 June 04

MK

Maxim Khrisanfov in catboost_ru

вызов функции get_object_importance съедает всю оперативку, больше 30 гигабайт и залезает в своп, дальше не стал проверять, так и должно быть? передаю pool=25k строк и train_pool=75k строк

источник

00:14пожаловаться #8

SB

Sergey Birkun in catboost_ru

Привет, маловероятно, но вдруг: возможно ли указать для регрессии что все тагеты больше нуля?

источник

15:58пожаловаться #9

A

Aнтон in catboost_ru

Привет, маловероятно, но вдруг: возможно ли указать для регрессии что все тагеты больше нуля?

Не подойдёт ли под логарифм его загнать предварительно, а получив прогноз - прогноз под экспоненту? 🙃

источник

18:40пожаловаться #10

A

Aнтон in catboost_ru

Хотя это может быть не лучше чем просто "обнулять" отрицательные прогнозы, в зависимости от области определения таргета

источник

18:41пожаловаться #11

SB

Sergey Birkun in catboost_ru

@rubyr0id да, может быть не лучшим, но попробую. Спасибо

источник

18:49пожаловаться #12

2019 June 06

DB

Dmitry Barychev in catboost_ru

Всем привет! Меня зовут Дмитрий Барычев, руководитель сервиса Отследить-посылку.рф . Мы строим можель в катбусте по прогнозу, выкупит или нет человек следующую посылку, отправленную Почтой России наложенным платежом. У нас в базе 200 млн посылок и 1 млрд писем. Модель построили в катбусте, но пока результат не очень. Ищу специалиста, кто может выделять час времени в день, чтобы нам помогать или взять в работу весь проект. Отзовитесь, пожалуйста! Очень надо. Нам срочно. Отблагодарим щедро!)

источник

14:39пожаловаться #13

A

Andrey in catboost_ru

Что значит "не очень"? Почему сразу катбуст, что с другими алгоритмами?

источник

14:56пожаловаться #14

DB

Dmitry Barychev in catboost_ru

кликхаус

источник

15:12пожаловаться #15

DB

Dmitry Barychev in catboost_ru

не очень - 79% точности

источник

15:12пожаловаться #16

DB

Dmitry Barychev in catboost_ru

хочется 95

источник

15:12пожаловаться #17

A

Andrey in catboost_ru

Уже почти все понятно. Какая доля посылок "выкупается"?

источник

15:14пожаловаться #18

DB

Dmitry Barychev in catboost_ru

85 в среднем, но разброс от 55 до 95

источник

15:16пожаловаться #19

A

Andrey in catboost_ru

Тогда точность 85 получается вообще без моделей

источник

15:16пожаловаться #20