Телеграмм чат группы catboost_ru страница 89

parrot.ru

Рейтинг популярных групп и каналов

В рейтинге участвует:

групп:

каналов:

Виртуальный сервер на SSD - недорого!

Аренда выделенных и виртуальных серверов (VDS/VPS), хостинг, аренда IP-адресов, администрирование, круглосуточная поддержка

qwarta.ru подробнее

Резервное копирование с проверкой на вирусы!!!

Удобный сервис создания резервных копий на любой сервер сети интернет. Отслеживайте изменения, проверяйте на вирусы. Надежно защитите свой бизнес!

go.backupland.com

Выбираете сервер? Любая конфигурация на заказ!

Аренда физических серверов любых конфигураций под любые запросы - 1С бухгалтерия, игровые сервера, нагруженные проекты, интернет-магазины!

qwarta.ru подробнее

Size: a a a

catboost_ru

553 membersпожаловаться на группу

1
«
…
‹
84
85
86
87
88
89
90
›
…
»

2019 April 09

AD

Anna Veronika Dorogush in catboost_ru

ID:611170311

what loss functoins may be used for binary classificaton? There are only 2 of them in link
https://catboost.ai/docs/concepts/loss-functions-classification.html
I think about minimum probability to mistake for not balanced data,
for example probaility of 1s is 0.05 and probability of 0s is 0.95, so we need F1 metric as loss function?

https://scikit-learn.org/stable/modules/generated/sklearn.metrics.f1_score.html with 'weighted' and maybe micro

loss function should be the same as metric? why to optimise for one function and measure performance by anothe function
as he mentioned logloss is useless https://youtu.be/xl1fwCza9C8?t=1383

Classification: objectives and metrics - CatBoost. Documentation

Name Used for optimization User-defined parameters Formula and/or description Logloss + use_weights Default: true Calculation principles CrossEntropy + use_weights Default: true Calculation principles Precision – use_weights Default: true Calculation principles Recall – use_weights Default: true Calculation principles F1 – use_weights Default: true Calculation principles BalancedAccuracy – use_weights Default: true Calculation principles BalancedErrorRate – use_weights Default: true Calculation principles MCC – use_weights Default: true Calculation principles Accuracy – use_weights Default: true Calculation principles CtrFactor – use_weights Default: true Calculation principles AUC* – use_weights Default: false type Default: “Classic” for models with Logloss and CrossEntropy loss functions and “Ranking” for models with ranking loss functions. Classic The sum is calculated on all pairs of objects such that: Refer to the Wikipedia article for details.If the target type is not binary, then every object with target…

Вроде на все вопросы выше в ods чате и в issues-ах ответила, как могла, наверное тут третий раз не имеет смысла дублировать.

источник

00:37пожаловаться #1

P🐈

Pavel Tyavin 🐈 in catboost_ru

Anna Veronika Dorogush

Вроде да. У нас есть еще туториал на титанике, можно туда заглянуть. Но там вроде не из файла чтение.

Решил свою проблему. Чтение из csv , в котором delimiter="," подвело. Запятые в строках в кавычках интерпретировались как разделитель

источник

00:38пожаловаться #2

AD

Anna Veronika Dorogush in catboost_ru

а, да, мы как раз из-за титаника issue сделали - читать правильно запятые.

источник

00:38пожаловаться #3

AD

Anna Veronika Dorogush in catboost_ru

там help wanted - помогайте!

источник

00:39пожаловаться #4

IP

Igor Petrov in catboost_ru

Если дата записана форматом: день недели; час дня
То
день недели - категориальный
час дня - не категориальный
Или вообще не принципиально?

источник

09:09пожаловаться #5

AF

Alexey Filimonov in catboost_ru

Подскажите пожалуйста как можно посчитать, сколько потребляется памяти на GPU в процессе обучения? От чего зависит объём потребляемой памяти?

источник

09:13пожаловаться #6

AD

Anna Veronika Dorogush in catboost_ru

Alexey Filimonov

Подскажите пожалуйста как можно посчитать, сколько потребляется памяти на GPU в процессе обучения? От чего зависит объём потребляемой памяти?

Мы планируем в питон добавить функцию рассчета памяти. Можно будет в код ее посмотреть, там все будет. Сделай, пожалуйста, issue, отпишемся в него, когда добавим.

источник

10:45пожаловаться #7

AF

Alexey Filimonov in catboost_ru

Anna Veronika Dorogush

Мы планируем в питон добавить функцию рассчета памяти. Можно будет в код ее посмотреть, там все будет. Сделай, пожалуйста, issue, отпишемся в него, когда добавим.

хорошо, спасибо за ответ)

источник

10:52пожаловаться #8

IP

Igor Petrov in catboost_ru

Андрей amber4eg

Если у тебя в заполненных значениях встречаются нулевые, то можно пропуски ещё попробовать заполнять сильно несуществующими значениями (типа -66666666 для температуры, например), или средними.

Советовали с Nan, но он не работает
cat_features must be integer or string, real number values and NaN values should be converted to string.

источник

11:05пожаловаться #9

ИБ

Иван Брагин in catboost_ru

Если дата записана форматом: день недели; час дня
То
день недели - категориальный
час дня - не категориальный
Или вообще не принципиально?

Лучше попробовать оба варианта, можно даже попробовать добавить каждый признак в двух вариантах (и категорией и не категорией). Если он будет категорией, на нем считается target encoding (если ctr_complexity >1 то энкодинг посчитается ещё и в совокупности с другими категориями), если признак обычный, на нем будут делаться сплиты.
Что для модели важнее - разбить на утро и вечер (выходные и будни) или посчитать процент positive в час ночи в субботу или и то и другое можно проверить эксперементальным путем.

источник

11:25пожаловаться #10

IP

Igor Petrov in catboost_ru

Иван Брагин

Лучше попробовать оба варианта, можно даже попробовать добавить каждый признак в двух вариантах (и категорией и не категорией). Если он будет категорией, на нем считается target encoding (если ctr_complexity >1 то энкодинг посчитается ещё и в совокупности с другими категориями), если признак обычный, на нем будут делаться сплиты.
Что для модели важнее - разбить на утро и вечер (выходные и будни) или посчитать процент positive в час ночи в субботу или и то и другое можно проверить эксперементальным путем.

ну самое главное нету разницы в результате

источник

11:26пожаловаться #11

ИБ

Иван Брагин in catboost_ru

если нет разницы, то лучше не делать его категорией, категории жрут больше памяти и время

источник

11:27пожаловаться #12

ИБ

Иван Брагин in catboost_ru

Статья готова
https://habr.com/ru/post/447376/
перевод пока не осилил, может на основе комментариев поправлю и на следующих выходных переведу.
По настройкам catboost мог в чем то ошибится, буду рад замечаниям

SNA Hackathon 2019

В феврале-марте 2019 года проходил конкурс по ранжированию ленты социальной сети SNA Hackathon 2019, в котором наша команда заняла первое место. В статье я расск...

источник

12:16пожаловаться #13

IP

Igor Petrov in catboost_ru

Иван Брагин

если нет разницы, то лучше не делать его категорией, категории жрут больше памяти и время

спасибо

источник

12:21пожаловаться #14

AD

Anna Veronika Dorogush in catboost_ru

Иван Брагин

Статья готова
https://habr.com/ru/post/447376/
перевод пока не осилил, может на основе комментариев поправлю и на следующих выходных переведу.
По настройкам catboost мог в чем то ошибится, буду рад замечаниям

SNA Hackathon 2019

В феврале-марте 2019 года проходил конкурс по ранжированию ленты социальной сети SNA Hackathon 2019, в котором наша команда заняла первое место. В статье я расск...

Здорово, отлично получилось! Мы поделимся у себя в контакте и твиттере.

источник

12:34пожаловаться #15

AD

Anna Veronika Dorogush in catboost_ru

у тебя есть логин в твиттере, чтобы тебя затегать?

источник

12:34пожаловаться #16

ИБ

Иван Брагин in catboost_ru

Anna Veronika Dorogush

у тебя есть логин в твиттере, чтобы тебя затегать?

не, я не пользуюсь

источник

12:35пожаловаться #17

SK

Stanislav Kirillov in catboost_ru

Иван Брагин

Статья готова
https://habr.com/ru/post/447376/
перевод пока не осилил, может на основе комментариев поправлю и на следующих выходных переведу.
По настройкам catboost мог в чем то ошибится, буду рад замечаниям

SNA Hackathon 2019

В феврале-марте 2019 года проходил конкурс по ранжированию ленты социальной сети SNA Hackathon 2019, в котором наша команда заняла первое место. В статье я расск...

Классная статья! :)

источник

12:39пожаловаться #18

MK

Maxim Khrisanfov in catboost_ru

Иван Спасибо за статью.
Из статьи: bagging_temperature - Уменьшение значения ведет к увеличению оверфита.
Это точно так? В том видео, на которое ты ссылаешься, не говорится такое, насколько я помню там речь шла о random_strength и L2.

источник

13:34пожаловаться #19

IP

Igor Petrov in catboost_ru

0.13.1 нельзя передать категориальные признаки названием столбцов
Invalid cat_features[0] = Запрос вручную value type=<class 'str'>: must be int().

источник

13:36пожаловаться #20

1
«
…
‹
84
85
86
87
88
89
90
›
…
»