Size: a a a

AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2

2021 February 25

kk

k k in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
источник

MC

Makha Cloud in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
k k
Ребят, а что делать, если алгоритм показал , что все данные в датафрейме выбросы (три переменные всего) ?
Алгоритм = межквартильные интервалы
Значит нужно снизить требования к выбросам)
источник

kk

k k in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
источник

MC

Makha Cloud in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
k k
Погоди, у тебя там что одно число?)
источник

kk

k k in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
У меня получается типо эти квартили одинаковые...
источник

kk

k k in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Makha Cloud
Погоди, у тебя там что одно число?)
Хм..
источник

EZ

Evgenii Zheltonozhsk... in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
k k
ну либо ошибка, либо у тебя большинство данных с одним и тем же значением
источник

kk

k k in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Evgenii Zheltonozhskii🇮🇱
ну либо ошибка, либо у тебя большинство данных с одним и тем же значением
Ну как бы да, большинство данных с одним и тем же значением, но это разве значит что это выбросы все (?)
источник

MC

Makha Cloud in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
k k
Ну как бы да, большинство данных с одним и тем же значением, но это разве значит что это выбросы все (?)
А зачем тогда тебе выбросы?
источник

EZ

Evgenii Zheltonozhsk... in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
k k
Ну как бы да, большинство данных с одним и тем же значением, но это разве значит что это выбросы все (?)
ну если у тебя 95% значений х и ты хочешь выкинуть 5% крайних, то это будет все кроме х
источник

kk

k k in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Evgenii Zheltonozhskii🇮🇱
ну если у тебя 95% значений х и ты хочешь выкинуть 5% крайних, то это будет все кроме х
))
источник

kk

k k in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Ну у меня такое распределение
источник

kk

k k in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Makha Cloud
А зачем тогда тебе выбросы?
Хм... Я хотел для двух групп посчитать критерий мана Уитни, так как распределение не нормально в группе 2...только потом я подумал, может это просто выбросы...и когда я уберу выбросы..может тогда распределение станет нормальным...или не станет ?
источник

kk

k k in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Блин, хотя хрен поймёшь нормальное или не нормальное распределение, палки какие-то торчат..
источник

kk

k k in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Распределение надо же смотреть после того как выкинешь выбросы, верно ?
источник

MC

Makha Cloud in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
k k
Хм... Я хотел для двух групп посчитать критерий мана Уитни, так как распределение не нормально в группе 2...только потом я подумал, может это просто выбросы...и когда я уберу выбросы..может тогда распределение станет нормальным...или не станет ?
Стало) лучше смени интерквартильный  размах, на среднеквадратичное отклонение. Потому что в твоём случае медиана и квартили попадают на одно и то же число
источник

S

Ssv in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
k k
Распределение надо же смотреть после того как выкинешь выбросы, верно ?
источник

SD

Sergey Dulikov in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
У меня такое впечатление, что вы каким-то карго-культом занимаетесь. Вы сначала решите какие математические действия хотите делать, а потом уже как это обзывать. Выше логично сказали, что если абсолютное большинство значений одинаковы, то выкидывание 5% квантилей с обеих сторон только это значение и оставит. Называть выкинутые выбросами или нет, это вопрос философский.
источник

SD

Sergey Dulikov in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
На распределение логично смотреть как оно есть, если оно выглядит как нормальное с выбросами, то оно нормальное с выбросами, если как одна большая палка и по мелочи вокруг, то это на нормальное не похоже)
источник

kk

k k in AI / Big Data / Machine Learning 👮‍♂️ Protected by R2D2
Спасибо
источник