Телеграмм чат группы catboost_ru страница 114

parrot.ru

Рейтинг популярных групп и каналов

В рейтинге участвует:

групп:

каналов:

Виртуальный сервер на SSD - недорого!

Аренда выделенных и виртуальных серверов (VDS/VPS), хостинг, аренда IP-адресов, администрирование, круглосуточная поддержка

qwarta.ru подробнее

Резервное копирование с проверкой на вирусы!!!

Удобный сервис создания резервных копий на любой сервер сети интернет. Отслеживайте изменения, проверяйте на вирусы. Надежно защитите свой бизнес!

go.backupland.com

Выбираете сервер? Любая конфигурация на заказ!

Аренда физических серверов любых конфигураций под любые запросы - 1С бухгалтерия, игровые сервера, нагруженные проекты, интернет-магазины!

qwarta.ru подробнее

Size: a a a

catboost_ru

553 membersпожаловаться на группу

2019 May 18

OT

Oscar Tempter in catboost_ru

К каждому из классов

источник

18:42пожаловаться #1

Д

Дмитрий in catboost_ru

Понял, спасибо большое)

источник

18:42пожаловаться #2

Д

Дмитрий in catboost_ru

Не сходится в 1-2%, странно

источник

18:57пожаловаться #3

IC

Igor Cage in catboost_ru

Кто нибудь может подсказать как загружать train_data и train_lables из файла? По примерам на сайте катбуста не смог понять как это сделать, похоже я слишком туп 🙈

источник

22:18пожаловаться #4

Аa

Андрей amber4eg in catboost_ru

загрузи их в pandas.DataFrame, а его отдай котику

источник

22:19пожаловаться #5

AD

Anna Veronika Dorogush in catboost_ru

Igor Cage

Кто нибудь может подсказать как загружать train_data и train_lables из файла? По примерам на сайте катбуста не смог понять как это сделать, похоже я слишком туп 🙈

Можно создать класс Pool из файла. По умолчанию считается, что в первой колонке таргет, в остальных числовые фичи. Если это не так, надо еще сделать файл с column description, в котором будет написано, что в какой колонке

источник

23:27пожаловаться #6

IC

Igor Cage in catboost_ru

спасибо буду копать)

источник

23:28пожаловаться #7

2019 May 19

S

Sunsh1ne in catboost_ru

Подскажите, как заставить модель выдать ранжированный список наиболее вероятных вариантов. Нашел как обучать модель ранжирования, но не понимаю, как получить топ 10 результатов от модели.
Вот, например, этот туториал
https://github.com/catboost/catboost/tree/master/catboost/tutorials/ranking
То есть я хочу понять, как Яндекс использует CatBoost в ранжировании поисковой выдачи

catboost/catboost

A fast, scalable, high performance Gradient Boosting on Decision Trees library, used for ranking, classification, regression and other machine learning tasks for Python, R, Java, C++. Supports comp...

источник

13:28пожаловаться #8

AD

Anna Veronika Dorogush in catboost_ru

нужно сделать предсказание на всем, отсортировать по полученному скору и выбрать топ 10

источник

13:31пожаловаться #9

S

Sunsh1ne in catboost_ru

то есть у Яндекса миллионы страниц по запросу и они по всем делают предсказания и сортируют по полученному скору от CatBoost?

источник

13:32пожаловаться #10

AD

Anna Veronika Dorogush in catboost_ru

Сначала другими методами выбирается топ сколько-то, которые потом будем ранжировать.

источник

13:33пожаловаться #11

S

Sunsh1ne in catboost_ru

понял, вопросов нет, спасибо за помощь)

источник

13:34пожаловаться #12

2019 May 20

Д

Дмитрий in catboost_ru

Подскажите, пожалуйста, почему AUC ROC датасет1 > датасет2, но при этом accuracy1 < accuracy2?

источник

08:14пожаловаться #13

S

Sunsh1ne in catboost_ru

Подскажите, пожалуйста, почему AUC ROC датасет1 > датасет2, но при этом accuracy1 < accuracy2?

Это разные метрики, в этом видео рассказывается что такое AUC и много других полезных вещей

https://youtu.be/xl1fwCza9C8

089. Мастер класс Решение задач классификации при помощи CatBoost – Никита Дмитриев

PyData Moscow, 13 октября 2018 г. Градиентный бустинг — метод машинного обучения, появление которого привело к прорыву в решении многих задач, включая поиск ...

источник

08:18пожаловаться #14

Д

Дмитрий in catboost_ru

Спасибо

источник

08:18пожаловаться #15

A

Aнтон in catboost_ru

Подскажите, пожалуйста, почему AUC ROC датасет1 > датасет2, но при этом accuracy1 < accuracy2?

Простите за ответ в традициях it-форумов, но по-моему accuracy вообще редко для каких задач годится

источник

10:58пожаловаться #16

Bo

Blen obema in catboost_ru

Простите за ответ в традициях it-форумов, но по-моему accuracy вообще редко для каких задач годится

почему?

источник

10:59пожаловаться #17

Д

Дмитрий in catboost_ru

А бинарной классификации с обучением с учителем я бы даже ее считал вместо AUC

источник

11:17пожаловаться #18

Д

Дмитрий in catboost_ru

При условии, что классы сбалансированы

источник

11:18пожаловаться #19

ИБ

Иван Брагин in catboost_ru

При условии, что классы сбалансированы

И при условии что бизнес задача именно в этой метрике, ROC AUC значительно лучше отражает качесто разбиения классов

источник

11:22пожаловаться #20