Телеграмм чат группы catboost_ru страница 134

parrot.ru

Рейтинг популярных групп и каналов

В рейтинге участвует:

групп:

каналов:

Виртуальный сервер на SSD - недорого!

Аренда выделенных и виртуальных серверов (VDS/VPS), хостинг, аренда IP-адресов, администрирование, круглосуточная поддержка

qwarta.ru подробнее

Резервное копирование с проверкой на вирусы!!!

Удобный сервис создания резервных копий на любой сервер сети интернет. Отслеживайте изменения, проверяйте на вирусы. Надежно защитите свой бизнес!

go.backupland.com

Выбираете сервер? Любая конфигурация на заказ!

Аренда физических серверов любых конфигураций под любые запросы - 1С бухгалтерия, игровые сервера, нагруженные проекты, интернет-магазины!

qwarta.ru подробнее

Size: a a a

catboost_ru

553 membersпожаловаться на группу

2019 June 12

AD

Anna Veronika Dorogush in catboost_ru

и еще можно уменьшать модель другими способами, см FAQ в документации, там вопрос про размер модели есть

источник

08:34пожаловаться #1

AS

Andrey Stroganov in catboost_ru

Ещё пожелание: не могли бы вы добавить в command line версию обработчик unix-сигнала какого-нибудь типа USR1 для промежуточного снапшота на случай если забыл указать --snapshot-file перед запуском

источник

08:35пожаловаться #2

AD

Anna Veronika Dorogush in catboost_ru

Это достаточно много работы и усложнение интерфейсов. Лучше не забывать указывать снэпшоты.

источник

08:38пожаловаться #3

AS

Andrey Stroganov in catboost_ru

Anna Veronika Dorogush

Это достаточно много работы и усложнение интерфейсов. Лучше не забывать указывать снэпшоты.

Да понятно что лучше 🙂 Кстати, раз в сколько итераций он сохраняет? В доке не нашел. Или он просто на каждой итерации дописывает в конец файла новое деревце?

источник

08:42пожаловаться #4

AD

Anna Veronika Dorogush in catboost_ru

Точно не помню, вроде раз в 5 минут. Добавим в документацию, спасибо, что заметил, что там нет этого!

источник

08:45пожаловаться #5

AS

Andrey Stroganov in catboost_ru

Может он просто на каждой итерации дописывает в конец файла новое деревце?

источник

08:46пожаловаться #6

AD

Anna Veronika Dorogush in catboost_ru

Сохраняем раз во сколько-то времени. Либо 5 минут, либо 10

источник

08:47пожаловаться #7

AS

Andrey Stroganov in catboost_ru

Спасибо. А ещё заметил в документации все ссылки "CatBoost JSON model tutorial" ведут на https://github.com/catboost/tutorials/blob/master/apply_model/model_export_as_json_tutorial.ipynb которая 404 =(

источник

08:51пожаловаться #8

AD

Anna Veronika Dorogush in catboost_ru

Если замечаешь ошибки, лучше всего создавать issue, чтобы они потом не потерялись. Спасибо, что заметил! Если не сложно, открой issue

источник

08:52пожаловаться #9

AD

Anna Veronika Dorogush in catboost_ru

https://github.com/catboost/tutorials/blob/master/apply_model/json/model_export_as_json_tutorial.ipynb - вот правильная ссылка

источник

08:53пожаловаться #10

NM

Námo Morimando in catboost_ru

!report

источник

15:05пожаловаться #11

2019 June 13

Д

Дмитрий in catboost_ru

Спасибо, теперь понял)

источник

16:11пожаловаться #12

Д

Дмитрий in catboost_ru

деревья подбираются последовательно

источник

16:11пожаловаться #13

Д

Дмитрий in catboost_ru

А вот подбор самого дерево параллелиться по данным (большое число вычислениц можно делать в много потоков)

источник

16:11пожаловаться #14

2019 June 14

P🐈

Pavel Tyavin 🐈 in catboost_ru

Что означает ошибка "blocks must be big enough to contain more than a single group" ?

источник

15:05пожаловаться #15

AK

Andrei Khropov in catboost_ru

При применении из CLI CatBoost читает датасет блоками не больше чем фиксированное число документов, при этом если данные по группам, то есть техническое ограничение, чтобы размер блока был не больше самой большой группы.

Это ограничение планируется исправить.

Пока для применения, если это не расчет метрик, где учитываются группы, могу посоветовать передавать cd-файл где не будет колонок GroupId/QueryId и SubgroupId, а соответствующие колонки будут помечены как Auxiliary.

источник

15:59пожаловаться #16

AK

Andrei Khropov in catboost_ru

Ну или использовать python API, там данные загружаются целиком

источник

16:00пожаловаться #17

AS

Andrey Stroganov in catboost_ru

А где почитать про группы/подгруппы и зачем они нужны?

источник

18:25пожаловаться #18

AK

Andrei Khropov in catboost_ru

группы - просто можно сгруппировать данные по какому-то признаку

источник

18:35пожаловаться #19

P🐈

Pavel Tyavin 🐈 in catboost_ru

При применении из CLI CatBoost читает датасет блоками не больше чем фиксированное число документов, при этом если данные по группам, то есть техническое ограничение, чтобы размер блока был не больше самой большой группы.

Это ограничение планируется исправить.

Пока для применения, если это не расчет метрик, где учитываются группы, могу посоветовать передавать cd-файл где не будет колонок GroupId/QueryId и SubgroupId, а соответствующие колонки будут помечены как Auxiliary.

Спасибо, помогло

источник

18:36пожаловаться #20