Телеграмм чат группы catboost_ru страница 284

parrot.ru

Рейтинг популярных групп и каналов

В рейтинге участвует:

групп:

каналов:

Виртуальный сервер на SSD - недорого!

Аренда выделенных и виртуальных серверов (VDS/VPS), хостинг, аренда IP-адресов, администрирование, круглосуточная поддержка

qwarta.ru подробнее

Резервное копирование с проверкой на вирусы!!!

Удобный сервис создания резервных копий на любой сервер сети интернет. Отслеживайте изменения, проверяйте на вирусы. Надежно защитите свой бизнес!

go.backupland.com

Выбираете сервер? Любая конфигурация на заказ!

Аренда физических серверов любых конфигураций под любые запросы - 1С бухгалтерия, игровые сервера, нагруженные проекты, интернет-магазины!

qwarta.ru подробнее

Size: a a a

catboost_ru

700 membersпожаловаться на группу

2020 May 20

IL

Ivan Lyzhin in catboost_ru

Это пофиксили в 0.23.1. Ошибка была в сохранении модели, поэтому, чтобы все заработало, модель должна быть обучена и сохранена версией катбуста не ниже 0.23.1.

источник

18:04пожаловаться #1

AM

Alexander Manushin in catboost_ru

Это пофиксили в 0.23.1. Ошибка была в сохранении модели, поэтому, чтобы все заработало, модель должна быть обучена и сохранена версией катбуста не ниже 0.23.1.

Спасибо

источник

23:21пожаловаться #2

2020 May 21

OT

Oscar Tempter in catboost_ru

А есть возможность использовать catboost с внешней видеокартой на ноутбуке подключенной как eGPU ?

источник

18:48пожаловаться #3

AK

Andrei Khropov in catboost_ru

CatBoost использует CUDA для работы с GPU. Если драйвер nVidia эту видеокарту видит, то скорее всего будет работать.

источник

21:10пожаловаться #4

2020 May 22

OT

Oscar Tempter in catboost_ru

Почему у меня очень сильно разнятся результаты встроенной метрики PRAUC на валидационном сете и на кастомной метрике ? Для кастомной метрики использую функции из sklearn
class pr_auc(object):
def is_max_optimal(self):
# Returns whether great values of metric are better
return True

def evaluate(self, approxes, target, weight):
# approxes is a list of indexed containers
# (containers with only len and getitem defined),
# one container per approx dimension.
# Each container contains floats.
# weight is a one dimensional indexed container.
# target is a one dimensional indexed container.

# weight parameter can be None.
# Returns pair (error, weights sum)

assert len(approxes) == 1
assert len(target) == len(approxes[0])

approx = approxes[0]

precision, recall, thresholds = precision_recall_curve(np.asarray(target), np.asarray(approx))
pr_auc = auc(recall, precision)
return pr_auc, 0

def get_final_error(self, error, weight):
# Returns final value of metric based on error and weight
return error

источник

10:48пожаловаться #5

2020 May 25

IP

Ivan Poddubny in catboost_ru

Всем привет. Порекомендуйте пож ссылку где используют catboost для множественной регрессии и анализируют фичи

источник

13:05пожаловаться #6

MF

Maxim FromSiberia in catboost_ru

Maxim FromSiberia

https://github.com/catboost/catboost/issues/1294

Different learning rate for CPU and GPU · Issue #1294 · catboost/catboost

Problem: catboost-0.23.exe fit --cd cd --task-type CPU -f train.csv --train-dir catboost.train.dir --delimiter , --verbose 10 -i 1000 --loss-function Logloss --model-file m.bin Learning rate set to...

Экспериментально видно, что learning rate определяемый на GPU хуже, чем на CPU. Поэтому запускаю catboost-0.23.exe на CPU, из STDOUT зачитываю learning rate, убиваю процесс catboost-0.23.exe, запускаю снова на GPU, явно задавая learning rate опцией.

Вот в такие позы вы ставите своих пользователей )

источник

15:43пожаловаться #7

SK

Stanislav Kirillov in catboost_ru

мы обязательно пофиксим эту багу :)

источник

15:43пожаловаться #8

MF

Maxim FromSiberia in catboost_ru

https://i.gyazo.com/7cac26f2262ea1ae460e6ffed3cb6b4d.png

источник

15:45пожаловаться #9

2020 May 26

В

Владимир in catboost_ru

Добрый день!

Надеюсь, вопрос уместен (он скорее фундаментальный для машинного обучения в целом, но скорее всего ответ зависит от используемых методов, моделей):

Стоит ли использовать при обучении дополнительные данные label (y), то есть предсказываемых значений, которые в не нужно предсказывать? Может ли это повысить точность модели?

Пока, к сожалению, не могу назвать датасет (сроки подачи решений еще не завершились, наверное, это неэтично). В любом случае, участвую только ради опыта.

Фактически нужно предсказать Да или Нет, но есть дополнительная количественная информация по выходным данным.

Попробую описать гипотетическую задачу: если бы речь шла о предсказании интересна пользователю User1 новость A, или нет (по сути у категории только 2 возможных значения), то стоит ли при обучении модели добавлять какие либо доступные данные например учить модель по данным Интересна(1 или 0, это собственно и нужно предсказать), время_просмотра_новости(количество минут).

Мне кажется, что такая информация в предсказываемых данных может повысить точность классификации, но уверенности нет, из прочитанной литературы к сожалению не могу вспомнить, советуют ли такое и тем более в каких случаях это стоит делать...

Сразу скажу, что вполне отдаю себе отчет, что есть более очевидный вариант: конечно, можно наоборот агрегировать подобные данные и использовать как входные: к примеру очевидно, что можно ввести дополнительные поля (как часто этот юзер читает новости, как много на них времени тратит, как часто эту новость читают итд). В этом плане вопросов по сути нет, уверен что такой подход пойдет на пользу.

А вот по поводу первого варианта (тренировка на предсказание 1+n значений и категорий чтобы предсказать только одну категорию) очень хотелось бы узнать, насколько такой подход адекватен?

Простите за избыточный текст. Спасибо!

источник

09:30пожаловаться #10

II

Ivan Ilin in catboost_ru

Всем привет! Скажите пожалуйста, как правильно подавать на вход эмбеддинги (векторы) параллельно с категориальными фичами и timestamp?
Данные хранятся в pandas, вариант разбить вектор на n столбцов выглядит несколько коряво

источник

18:28пожаловаться #11

2020 May 27

壬C

壬豪 Cana | CO-INITIAT... in catboost_ru

WOw

источник

01:06пожаловаться #12

KM

Kirill Malev in catboost_ru

壬豪 Cana | CO-INITIATIVE.IO ambassador.

WOw

спам(

источник

01:22пожаловаться #13

MF

Maxim FromSiberia in catboost_ru

Добрый день! Есть ли где-то описание алгоритма, по которому происходит автоматический выбор learning rate? Поделитесь ссылкой.

источник

08:35пожаловаться #14

ND

Nikita Dmitriev in catboost_ru

Всем привет! Скажите пожалуйста, как правильно подавать на вход эмбеддинги (векторы) параллельно с категориальными фичами и timestamp?
Данные хранятся в pandas, вариант разбить вектор на n столбцов выглядит несколько коряво

Привет!

Мы прям сейчас работаем над этой функциональностью
А пока - только разбивать на несколько столбцов

источник

11:06пожаловаться #15

II

Ivan Ilin in catboost_ru

Под капотом это предполагает независимость каждой фичи, в случае эмбеддингов это не совсем так

источник

11:07пожаловаться #16

ND

Nikita Dmitriev in catboost_ru

Maxim FromSiberia

Добрый день! Есть ли где-то описание алгоритма, по которому происходит автоматический выбор learning rate? Поделитесь ссылкой.

Привет!

Мы обучили лин модель, которая по статистикам датасета предсказывает лернинг рейт

источник

11:08пожаловаться #17

SK

Stanislav Kirillov in catboost_ru

Maxim FromSiberia

Добрый день! Есть ли где-то описание алгоритма, по которому происходит автоматический выбор learning rate? Поделитесь ссылкой.

https://github.com/catboost/catboost/blob/master/catboost/libs/train_lib/options_helper.cpp#L192 - текущие коэффициенты можно подсмотреть в коде

catboost/catboost

A fast, scalable, high performance Gradient Boosting on Decision Trees library, used for ranking, classification, regression and other machine learning tasks for Python, R, Java, C++. Supports comp...

источник

11:08пожаловаться #18

ND

Nikita Dmitriev in catboost_ru

Под капотом это предполагает независимость каждой фичи, в случае эмбеддингов это не совсем так

Все так
На данный момент только так..
Скоро добавим возможность передавать вектор эмбедингов как единую фичу

источник

11:10пожаловаться #19

II

Ivan Ilin in catboost_ru

Nikita Dmitriev

Все так
На данный момент только так..
Скоро добавим возможность передавать вектор эмбедингов как единую фичу

Спасибо

источник

11:11пожаловаться #20