Телеграмм чат группы catboost

мне казалось, что если запустить мултикласс-классификаицю при этом для каждой записи сделать отдельный класс -как целевую, то полученные деревья можно ли рассматривать как иерархическую кластеризацию

источник

21:49пожаловаться #5

2019 December 01

A

Alex.Ash in catboost_ru

Alexsey Shestacov

Классный доклад

Что за доклад?

источник

06:04пожаловаться #6

AS

Alexsey Shestacov in catboost_ru

на YaTalks

источник

10:48пожаловаться #7

AS

Alexsey Shestacov in catboost_ru

https://youtu.be/hXH_tRBxFnA

YouTube

Конференция YaTalks в Москве: прямая трансляция из зала технических докладов

#Прямосейчас смотрите прямую трансляцию малой сцены YaTalks — самой масштабной конференции Яндекса для разработчиков в 2019 году. Восемь технических докладов...

источник

10:56пожаловаться #8

N

Norx in catboost_ru

Python_for_Probability_Statistics_and_Machine_Learning.pdf

(7.14 Мб)

Python for Probability, Statistics, and Machine Learning

@ai_machinelearning_big_data

источник

22:57пожаловаться #9

AM

Alexander Manushin in catboost_ru

Коллеги, кто-нибудь может объяснить: как второе дерево в ансамбле деревьев градиентного бустинга изменяет значения первого для получения общего ответа модели? Складывает/усредняет или как-то ещё? Допустим у нас задача бинарной классификации, где нужно найти вероятность принадлежности объекта к классу 1. Допустим модель градиентного бустинга имеет только 2 дерева. В первом дереве объект прошёл по всему дереву, пришёл, допустим, в лист №1 и получил значение вероятности 0.7, во втором дереве, допустим, этот объект попал в лист №3 и получил значение 0.1. Что дальше с этими значениями делается для получения общего ответа модели по этому объект: 0.7 и 0.1 складываются или например берётся среднее арифметическое?
Сорри, если это какая-то очевидность для всех, но я лично как начинающий Data Scientist хотел бы до конца в этом вопросе разобраться. Спасибо заранее.

источник

23:06пожаловаться #10

SK

Stanislav Kirillov in catboost_ru

Alexander Manushin

Коллеги, кто-нибудь может объяснить: как второе дерево в ансамбле деревьев градиентного бустинга изменяет значения первого для получения общего ответа модели? Складывает/усредняет или как-то ещё? Допустим у нас задача бинарной классификации, где нужно найти вероятность принадлежности объекта к классу 1. Допустим модель градиентного бустинга имеет только 2 дерева. В первом дереве объект прошёл по всему дереву, пришёл, допустим, в лист №1 и получил значение вероятности 0.7, во втором дереве, допустим, этот объект попал в лист №3 и получил значение 0.1. Что дальше с этими значениями делается для получения общего ответа модели по этому объект: 0.7 и 0.1 складываются или например берётся среднее арифметическое?
Сорри, если это какая-то очевидность для всех, но я лично как начинающий Data Scientist хотел бы до конца в этом вопросе разобраться. Спасибо заранее.

В листьях деревьев записаны значения которые нужно суммировать, но это еще не вероятность. Чтоб получить вероятность (в режим бинкласса), к сумме значений листьев применяется сигмоида.

источник

23:09пожаловаться #11

AM

Alexander Manushin in catboost_ru

Stanislav Kirillov

В листьях деревьев записаны значения которые нужно суммировать, но это еще не вероятность. Чтоб получить вероятность (в режим бинкласса), к сумме значений листьев применяется сигмоида.

А значения в листьях могут быть любого знака или только положительные? И какие значения этой итоговой суммы соответствуют значению 0 и 1 сигмоиды? Допустим для одного объекта сумма значений листьев всех деревьев получиалсь 100, для другого 20, а для третьего 150. Будет ли значению суммы 150 соответствовать значение сигмоиды 1, а значению суммы 20 - значение сигмоиды 0 или как это определяется? Может быть есть какой-то доступный источник, где-то какими-то относительно простыми словами описан весь этот механизм работы алгоритма? (чтобы кучу вопросов тут не задавать)?

источник

23:36пожаловаться #12

AM

Alexander Manushin in catboost_ru

Или центр сигмоиды - всегда соответствует нулевой сумме значений листьев, а значения соответствующие 0 и 1 - это минимальное (отрицательное) и максимальное (положительное) значение суммы листьев среди всех объектов обучающей выборки?

источник

23:46пожаловаться #13

2019 December 02

NN

No Name in catboost_ru

Alexander Manushin

А значения в листьях могут быть любого знака или только положительные? И какие значения этой итоговой суммы соответствуют значению 0 и 1 сигмоиды? Допустим для одного объекта сумма значений листьев всех деревьев получиалсь 100, для другого 20, а для третьего 150. Будет ли значению суммы 150 соответствовать значение сигмоиды 1, а значению суммы 20 - значение сигмоиды 0 или как это определяется? Может быть есть какой-то доступный источник, где-то какими-то относительно простыми словами описан весь этот механизм работы алгоритма? (чтобы кучу вопросов тут не задавать)?

http://www.machinelearning.ru/wiki/images/7/7e/Sem03_ensembles_2014.pdf

источник

04:04пожаловаться #14

AM

Alexander Manushin in catboost_ru

No Name

http://www.machinelearning.ru/wiki/images/7/7e/Sem03_ensembles_2014.pdf

Спасибо.

источник

13:14пожаловаться #15

2019 December 03

K

K-S in catboost_ru

Stanislav Kirillov

В листьях деревьев записаны значения которые нужно суммировать, но это еще не вероятность. Чтоб получить вероятность (в режим бинкласса), к сумме значений листьев применяется сигмоида.

А можно теоретический вопрос. Если к сумме значений листьев применяется сигмоида, то по сути предсказаниям бустинга дальнейшая калибровка не нужна? (В отличии от того же случайного леса)

источник

12:56пожаловаться #16

AG

Artyom Gruzdev in catboost_ru

если кратко, то все равно нужно, а если подробно, вечером кину статьи, кстати, обрати внимание на калибровку сплайнами

источник

15:01пожаловаться #17

D

Dasha in catboost_ru

Коллеги, CatBoostClassifier(...).fit() на виртуальной машинке падает в jupyter на большом дата-сете (более 1 млн строк);
Сталкивался ли кто-либо с подобным и может ли подсказать, в какую сторону копать? Аппаратные ресурсы виртуальной машины, параметры самой модели, ещё какие-либо подводные камни?

источник

19:36пожаловаться #18

2019 December 04

A

Alex.Ash in catboost_ru

Dasha

Коллеги, CatBoostClassifier(...).fit() на виртуальной машинке падает в jupyter на большом дата-сете (более 1 млн строк);
Сталкивался ли кто-либо с подобным и может ли подсказать, в какую сторону копать? Аппаратные ресурсы виртуальной машины, параметры самой модели, ещё какие-либо подводные камни?

Большие дата сеты кидай на GPU

источник

05:11пожаловаться #19

IP

Igor Petrov in catboost_ru

Dasha

Коллеги, CatBoostClassifier(...).fit() на виртуальной машинке падает в jupyter на большом дата-сете (более 1 млн строк);
Сталкивался ли кто-либо с подобным и может ли подсказать, в какую сторону копать? Аппаратные ресурсы виртуальной машины, параметры самой модели, ещё какие-либо подводные камни?

jupyter зло

источник

05:35пожаловаться #20