Size: a a a

Data Science Chat

2021 August 22

IK

Ivan Krokhalyov in Data Science Chat
Возможно, Loss или Optimizer остались на cpu?
источник

D

Dima in Data Science Chat
Ну там есть разбиения, энтропия по шеннону ,которая считается как раз из вероятностей ( мб в ту сторону надо копать)
Тут не отвечу
источник

IK

Ivan Krokhalyov in Data Science Chat
по тому, какие обьекты попадают в лист дерева. Если во время обучения попало в лист из тренировочной выборки 11 обьектов класса "0" и 2 обьект класса "1", тогда в этом листе вероятность класса "1" 2/13
источник

AK

Alex K in Data Science Chat
ааа, прикольно!
источник

AK

Alex K in Data Science Chat
оон как-то так спросил, не припомню уже. То ли почему не линейная, то ли почему не ступенька. Вот не запомнил
источник

IK

Ivan Krokhalyov in Data Science Chat
то есть, в начале дерева эти вероятности близкие к 0.5, по мере построения дерева мы стараемся доводить одну из этих вероятностей до единицы
источник

Miss Очепятка... in Data Science Chat
Нет. Ежели доводит до 1 то это будет переобученное дерево. Вообще используют лес а не дерево.
источник

IK

Ivan Krokhalyov in Data Science Chat
ну если не ограничивать глубину построения дерева, то так и будет
источник

IK

Ivan Krokhalyov in Data Science Chat
То что деревья потом срезают - это уже другой вопрос
источник

Miss Очепятка... in Data Science Chat
Если срезать то у меня из опыта получается что нет разницы устремлять центральные ноды к 1 или же брать их случайным образом.
источник

Miss Очепятка... in Data Science Chat
Все результаты определяют только листовые ноды.
источник

IK

Ivan Krokhalyov in Data Science Chat
А зачем нужны листовые ноды с вероятностями 0.5? Они же ничего не разделяют, а надо бы чтобы один из классов там преобладал
источник

Miss Очепятка... in Data Science Chat
Когда деревья подрезают там уже вероятность отличная от 0,5 но результат даёт не само дерево а лес.
А вот ежели не подрезать то тогда стоит устремлять но у вас будет результат всегда 100 %. На примере ты ему кажешь кошку а дерево тебе говорит что это курица со 100% качеством.
источник

IK

Ivan Krokhalyov in Data Science Chat
Так известно, что единичное дерево есть слабым алгоритмом)
источник

IK

Ivan Krokhalyov in Data Science Chat
Конечно, как правило леса и бустинги оказываются сильнее
источник

AK

Alex K in Data Science Chat
а можно спросить, как потом деревья в лес ассаблируются. Вот есть у нас фича которая например попала в два разных дерева и дала разны вероятности в нодах и что потом
источник

D

Dima in Data Science Chat
все деревья отвечают и ответ усредняется
источник

D

Dima in Data Science Chat
лучше будет просмотреть еще раз курс от ОДС по мл,там вроде на все ваши вопросы есть ответы, кроме метрик
источник

AK

Alex K in Data Science Chat
ага, я по нему и учился. Похоже пора второй итерации
источник

Miss Очепятка... in Data Science Chat
Пока что я использую усреднение.
источник