Size: a a a

R language and Statistical data analysis

2020 January 13

PU

Philipp Upravitelev in R language and Statistical data analysis
Григорий Демин
expss::compare_means
огонь, сейчас попробую
источник

ГД

Григорий Демин in R language and Statistical data analysis
Если без пакетов:
источник

ГД

Григорий Демин in R language and Statistical data analysis
       stderr1 = sd1/sqrt(base1)
       stderr2 = sd2/sqrt(base2)
       stderr = sqrt(stderr1^2 + stderr2^2)
       df = stderr^4/(stderr1^4/(base1 - 1) + stderr2^4/(base2 - 1))
       t_statistic = (mean1 - mean2)/stderr
       2 * pt(-abs(t_statistic), df)
источник

PU

Philipp Upravitelev in R language and Statistical data analysis
Григорий Демин
       stderr1 = sd1/sqrt(base1)
       stderr2 = sd2/sqrt(base2)
       stderr = sqrt(stderr1^2 + stderr2^2)
       df = stderr^4/(stderr1^4/(base1 - 1) + stderr2^4/(base2 - 1))
       t_statistic = (mean1 - mean2)/stderr
       2 * pt(-abs(t_statistic), df)
спасибо
кажется, я это видел в коде функции т-теста... не догадался оттуда выдрать :(
источник

ГД

Григорий Демин in R language and Statistical data analysis
Philipp Upravitelev
спасибо
кажется, я это видел в коде функции т-теста... не догадался оттуда выдрать :(
Да, это оттуда
источник

PU

Philipp Upravitelev in R language and Statistical data analysis
по stderr опознал %)
источник

А[

Александр [capsula] in R language and Statistical data analysis
Philipp Upravitelev
коллеги, наивный вопрос
у меня есть метрика, которая считается как value1/value2. хочу сравнить эту метрику в двух группах
проблема в том, что очень часто value2 равна 0, то есть сама метрика равна Inf

спрашивается, как посчитать значимость? если удалять данные я не могу, делать коррекцию вида +1 в знаменателе кажется не очень правильны, метрика может поплыть
Бокс-Кокс? (x-y)/(x+y)?
источник

PU

Philipp Upravitelev in R language and Statistical data analysis
Александр [capsula]
Бокс-Кокс? (x-y)/(x+y)?
результат должен быть интерпретабелен, а с этим есть сложности, с суммой, в частности
источник

А[

Александр [capsula] in R language and Statistical data analysis
Philipp Upravitelev
результат должен быть интерпретабелен, а с этим есть сложности, с суммой, в частности
Вообще никаких проблем. Вин:Фейл - x/y - (x-y)/(x+y):
99:1 - 99 - 0.98
50:50 - 1 - 0
1:99 - около 0.01 - минус 0.98
источник

А[

Александр [capsula] in R language and Statistical data analysis
Меньше нуля - нуп, больше нуля - читор, все интуитивно
источник

А[

Александр [capsula] in R language and Statistical data analysis
И значения стандартизированы, хотя это не всегда полезно
источник

АК

Артём Клевцов in R language and Statistical data analysis
Philipp Upravitelev
результат должен быть интерпретабелен, а с этим есть сложности, с суммой, в частности
Жалкие попытки кожаных мешков в последние годы своего существования как разумного вида 😁
источник

PU

Philipp Upravitelev in R language and Statistical data analysis
мне кажется, sapiens в названии вида весьма оптимистичен, да
erectus больше подходит %)
источник

АК

Артём Клевцов in R language and Statistical data analysis
Артём Клевцов
Жалкие попытки кожаных мешков в последние годы своего существования как разумного вида 😁
Я к тому, что интерпретируемость - это субъективно и зависит от опыта и привычек. Никто не воспрещает внедрить/навязать метрику, объяснить её и в конечно итоге приучить к ней.
На этом ещё защитить чего можно иногда.
источник

ВК

Владимир Калинин in R language and Statistical data analysis
кто нибудь может доступно объяснить, чем отличается bagging tree от random forest?
источник

ВК

Владимир Калинин in R language and Statistical data analysis
"Основное различие случайного леса и бэггинга на деревьях решений заключается в том, что в случайном лесе выбирается случайное подмножество признаков, и лучший признак для разделения узла определяется из подвыборки признаков, в отличие от бэггинга, где все функции рассматриваются для разделения в узле." Вот как на хабре объясняют.  Но мне непонятно (
источник

А

Александр in R language and Statistical data analysis
Строишь пачку деревьев, в первом случае каждое дерево строится по рандомной подвыборке фичей (не по всем), в втором случае каждое дерево строится по всем фичам каждый раз
источник

ВК

Владимир Калинин in R language and Statistical data analysis
в бэггинге все фичи?
источник

DP

Dmitry Penzar in R language and Statistical data analysis
Владимир Калинин
"Основное различие случайного леса и бэггинга на деревьях решений заключается в том, что в случайном лесе выбирается случайное подмножество признаков, и лучший признак для разделения узла определяется из подвыборки признаков, в отличие от бэггинга, где все функции рассматриваются для разделения в узле." Вот как на хабре объясняют.  Но мне непонятно (
Дебил кто так на хабре объясняет
источник

DP

Dmitry Penzar in R language and Statistical data analysis
Случайный лес это частный случай бэггинга
источник