Телеграмм чат группы catboost_ru страница 86

parrot.ru

Рейтинг популярных групп и каналов

В рейтинге участвует:

групп:

каналов:

Виртуальный сервер на SSD - недорого!

Аренда выделенных и виртуальных серверов (VDS/VPS), хостинг, аренда IP-адресов, администрирование, круглосуточная поддержка

qwarta.ru подробнее

Резервное копирование с проверкой на вирусы!!!

Удобный сервис создания резервных копий на любой сервер сети интернет. Отслеживайте изменения, проверяйте на вирусы. Надежно защитите свой бизнес!

go.backupland.com

Выбираете сервер? Любая конфигурация на заказ!

Аренда физических серверов любых конфигураций под любые запросы - 1С бухгалтерия, игровые сервера, нагруженные проекты, интернет-магазины!

qwarta.ru подробнее

Size: a a a

catboost_ru

553 membersпожаловаться на группу

1
«
…
‹
81
82
83
84
85
86
87
›
…
»

2019 April 04

SS

Sergey Shalnov in catboost_ru

Да, после SNA2019 для меня так и остались загадкой несколько вопросов:
1. Как же всё таки по умолчанию преобразуются кат фичи? https://catboost.ai/docs/concepts/algorithm-main-stages_cat-to-numberic.html#algorithm-main-stages_cat-to-numberic - тут нет ничего про дефолтные значения. Дальше это всё бьётся на бины, но тоже нигде нет упоминания про дефолтные значения. Например в описании simple_ctr
2. Почему нельзя засунуть в cat_features int32 колонку когда создаёшь пул из FeaturesData? С чем связано такое ограничение?
3. Чем ещё, кроме кол-ва бинов, по дефолту отличаются CPU и GPU режимы бинарной классификации. У меня результат на GPU получался лучше, но я так и не раскопал из за какого именно параметра)
4. Почему же у нас с Иван Брагин так и не взлетел Learning to Rank ни в одном из вариантов, хотя мы перепробовали и YetiRank и QueryCrossEntropy и PairLogit? Вроде по логике такой подход ближе к целевой метрике соревнования, что можете посоветовать попробовать?

источник

20:05пожаловаться #1

AD

Anna Veronika Dorogush in catboost_ru

> 1. Как же всё таки по умолчанию преобразуются кат фичи? https://catboost.ai/docs/concepts/algorithm-main-stages_cat-to-numberic.html#algorithm-main-stages_cat-to-numberic - тут нет ничего про дефолтные значения. Дальше это всё бьётся на бины, но тоже нигде нет упоминания про дефолтные значения. Например в описании simple_ctr

Мы планируем подробный туториал про это, просто пока руки не дошли

источник

20:06пожаловаться #2

AD

Anna Veronika Dorogush in catboost_ru

> 2. Почему нельзя засунуть в cat_features int32 колонку когда создаёшь пул из FeaturesData? С чем связано такое ограничение?

Это временно, пока не реализовали по-другому. Планируем сделать специальный тип - хешированная катфича. Тогда можно будет.

источник

20:07пожаловаться #3

AD

Anna Veronika Dorogush in catboost_ru

> 3. Чем ещё, кроме кол-ва бинов, по дефолту отличаются CPU и GPU режимы бинарной классификации. У меня результат на GPU получался лучше, но я так и не раскопал из за какого именно параметра)

И про это планируем туториал

источник

20:07пожаловаться #4

SS

Sergey Shalnov in catboost_ru

Anna Veronika Dorogush

> 3. Чем ещё, кроме кол-ва бинов, по дефолту отличаются CPU и GPU режимы бинарной классификации. У меня результат на GPU получался лучше, но я так и не раскопал из за какого именно параметра)

И про это планируем туториал

Ну хоть примерно? )

источник

20:08пожаловаться #5

AD

Anna Veronika Dorogush in catboost_ru

> 4. Почему же у нас с Иван Брагин так и не взлетел Learning to Rank ни в одном из вариантов, хотя мы перепробовали и YetiRank и QueryCrossEntropy и PairLogit? Вроде по логике такой подход ближе к целевой метрике соревнования, что можете посоветовать попробовать?

Не знаю, про что было соревнование, но очень советую вместо YetiRank и PairLogit использовать YetiRankPairwise и PairLogitPairwise, они дольше учатся, но в итоге обычно лучше.

источник

20:09пожаловаться #6

AS

Artem Seleznev in catboost_ru

Привет 👋 сообщество и разработчики нашего любимого Буста.

Завтра ☝️будет внутренняя лекция в МегаФоне, где будет представлено решение на CatBoost.

После этого ряд публикаций на хабре об этом бустинге!

источник

20:09пожаловаться #7

AD

Anna Veronika Dorogush in catboost_ru

Sergey Shalnov

Ну хоть примерно? )

На самом деле не так много отличий. Есть несколько параметров, которые не поддержаны пока что на гпу. Например, model_size_reg. На цпу он по умолчанию ненулевой, если его убрать, то модель будет больше, но возможно качество немного улучшится. Но вообще мы подбирали так, чтобы качество не ухудшалось. Есть набор параметров, которых наоборот нет на цпу. В принципе качество от перехода между гпу и цпу меняться должно очень мало. Не больше, чем от изменения рандом сида.

источник

20:11пожаловаться #8

AD

Anna Veronika Dorogush in catboost_ru

Привет 👋 сообщество и разработчики нашего любимого Буста.

Завтра ☝️будет внутренняя лекция в МегаФоне, где будет представлено решение на CatBoost.

После этого ряд публикаций на хабре об этом бустинге!

Ура-ура!

источник

20:11пожаловаться #9

AC

Alexander C in catboost_ru

Коллеги, как ваш
биннинг работает?

источник

20:13пожаловаться #10

AS

Artem Seleznev in catboost_ru

источник

20:18пожаловаться #11

AD

Anna Veronika Dorogush in catboost_ru

Alexander C

Коллеги, как ваш
биннинг работает?

ты про квантизацию во время предобработки?

источник

20:20пожаловаться #12

AC

Alexander C in catboost_ru

Anna Veronika Dorogush

ты про квантизацию во время предобработки?

Да

источник

20:21пожаловаться #13

AD

Anna Veronika Dorogush in catboost_ru

Вот тут есть описания поддержанных биннингов https://catboost.ai/docs/concepts/binarization.html.
По умолчанию оптимизируем сумму логарифмов жадностью (GreedyLogSum).
Это быстро и хорошо работает. Можно динамикой точное решение находить (MaxLogSum и MinEntropy), это дольше, а работает на самом деле также. Еще можно Uniform например делать, тогда ты будешь смотреть на абсолютные значения фичей.

Binarization

Before learning, the possible values of objects are divided into disjoint ranges (buckets) delimited by the threshold values (splits). The size of the binarization (the number of splits) is determined by the starting parameters (separately for numerical features and numbers obtained as a result of converting categorical features into numerical features).

источник

20:24пожаловаться #14

AC

Alexander C in catboost_ru

Anna Veronika Dorogush

Вот тут есть описания поддержанных биннингов https://catboost.ai/docs/concepts/binarization.html.
По умолчанию оптимизируем сумму логарифмов жадностью (GreedyLogSum).
Это быстро и хорошо работает. Можно динамикой точное решение находить (MaxLogSum и MinEntropy), это дольше, а работает на самом деле также. Еще можно Uniform например делать, тогда ты будешь смотреть на абсолютные значения фичей.

Binarization

Before learning, the possible values of objects are divided into disjoint ranges (buckets) delimited by the threshold values (splits). The size of the binarization (the number of splits) is determined by the starting parameters (separately for numerical features and numbers obtained as a result of converting categorical features into numerical features).

Спасибо посмотрю

источник

20:28пожаловаться #15

Аa

Андрей amber4eg in catboost_ru

А я говорил, что картинка с котиком - самая классная

источник

21:54пожаловаться #16

AS

Artem Seleznev in catboost_ru

Андрей amber4eg

А я говорил, что картинка с котиком - самая классная

Эх, еще бы стикер такой раздобыть 😊

источник

21:57пожаловаться #17

Аa

Андрей amber4eg in catboost_ru

В фотках чатика есть фото с крышки моего ноутбука :like-a-boss:

источник

21:58пожаловаться #18

Аa

Андрей amber4eg in catboost_ru

Или ты про стикеры телеги?

источник

21:59пожаловаться #19

A

Andrei in catboost_ru

как в catboost.cv подавать кастомное разбиение по фолдам?

источник

23:32пожаловаться #20

1
«
…
‹
81
82
83
84
85
86
87
›
…
»