Телеграмм чат группы datasciencechat страница 6973

Возможно, Loss или Optimizer остались на cpu?

11:12пожаловаться #1

Dima in Data Science Chat

Ну там есть разбиения, энтропия по шеннону ,которая считается как раз из вероятностей ( мб в ту сторону надо копать)
Тут не отвечу

11:13пожаловаться #2

по тому, какие обьекты попадают в лист дерева. Если во время обучения попало в лист из тренировочной выборки 11 обьектов класса "0" и 2 обьект класса "1", тогда в этом листе вероятность класса "1" 2/13

11:15пожаловаться #3

ааа, прикольно!

11:17пожаловаться #4

оон как-то так спросил, не припомню уже. То ли почему не линейная, то ли почему не ступенька. Вот не запомнил

11:18пожаловаться #5

то есть, в начале дерева эти вероятности близкие к 0.5, по мере построения дерева мы стараемся доводить одну из этих вероятностей до единицы

11:19пожаловаться #6

MО

Miss Очепятка... in Data Science Chat

Нет. Ежели доводит до 1 то это будет переобученное дерево. Вообще используют лес а не дерево.

11:21пожаловаться #7

ну если не ограничивать глубину построения дерева, то так и будет

11:21пожаловаться #8

То что деревья потом срезают - это уже другой вопрос

11:22пожаловаться #9

MО

Miss Очепятка... in Data Science Chat

Если срезать то у меня из опыта получается что нет разницы устремлять центральные ноды к 1 или же брать их случайным образом.

11:26пожаловаться #10

MО

Miss Очепятка... in Data Science Chat

Все результаты определяют только листовые ноды.

11:27пожаловаться #11

А зачем нужны листовые ноды с вероятностями 0.5? Они же ничего не разделяют, а надо бы чтобы один из классов там преобладал

11:28пожаловаться #12

MО

Miss Очепятка... in Data Science Chat

Когда деревья подрезают там уже вероятность отличная от 0,5 но результат даёт не само дерево а лес.
А вот ежели не подрезать то тогда стоит устремлять но у вас будет результат всегда 100 %. На примере ты ему кажешь кошку а дерево тебе говорит что это курица со 100% качеством.

11:33пожаловаться #13

Так известно, что единичное дерево есть слабым алгоритмом)

11:34пожаловаться #14

Конечно, как правило леса и бустинги оказываются сильнее

11:34пожаловаться #15

а можно спросить, как потом деревья в лес ассаблируются. Вот есть у нас фича которая например попала в два разных дерева и дала разны вероятности в нодах и что потом

11:34пожаловаться #16

Dima in Data Science Chat

все деревья отвечают и ответ усредняется

11:37пожаловаться #17

Dima in Data Science Chat

лучше будет просмотреть еще раз курс от ОДС по мл,там вроде на все ваши вопросы есть ответы, кроме метрик

11:37пожаловаться #18