Size: a a a

R language and Statistical data analysis

2020 March 13

АР

Александр Райков in R language and Statistical data analysis
Ну вы понаписали
источник

ЕТ

Евгений Томилов in R language and Statistical data analysis
Кстати, а что-то из тестов сейчас появилось новое модное, кроме перестановочных вариантов и байесовских аналогов? Я вторые сейчас разбираю, они выглядят как-то приятнее традиционных, можно больше гипотез тестировать по типу "какова вероятность, что различия больше 3, но меньше 5".
источник

АР

Александр Райков in R language and Statistical data analysis
Вилкоксон не сломается, комп железный
источник

АР

Александр Райков in R language and Statistical data analysis
Проблема срабатываний на большой выборке в том, что:
источник

ЕТ

Евгений Томилов in R language and Statistical data analysis
Александр Райков
Вилкоксон не сломается, комп железный
Он имеет же серьёзные проблемы с тем, что в реальной жизни рангов сравниваемых обычно немного. А когда они повторяются, всё плохо, недостоверно. Как минимум, я всегда так думал.
источник

А[

Александр [capsula] in R language and Statistical data analysis
Евгений Томилов
Он имеет же серьёзные проблемы с тем, что в реальной жизни рангов сравниваемых обычно немного. А когда они повторяются, всё плохо, недостоверно. Как минимум, я всегда так думал.
А если просто распределение ненормальное, а рангов столько же, сколько и значений?
источник

ЕТ

Евгений Томилов in R language and Statistical data analysis
Александр [capsula]
А если просто распределение ненормальное, а рангов столько же, сколько и значений?
Тогда всё ок, по идее.
источник

АР

Александр Райков in R language and Statistical data analysis
1) нулевая гипотеза в действительности вообще никогда не верна. Допустим, опросили всех в мире мужчин и женщин. У них будет АБСОЛЮТНО равное среднее? Очевидно, нет, два числа с плавающей точкой не могут повторяться. Но тот факт, что у мужчин мира в среднем на 0,0000000345 выше , бессмыслен для практики. Плюс Через секунду кто-то умрет и кто-то родится новый, перевернув столь малые различия
источник

А[

Александр [capsula] in R language and Statistical data analysis
Евгений Томилов
Тогда всё ок, по идее.
Всякие спектрофотометры валят те же щелочные фосфатазы с точностью до тысячных
источник

А[

Александр [capsula] in R language and Statistical data analysis
Александр Райков
1) нулевая гипотеза в действительности вообще никогда не верна. Допустим, опросили всех в мире мужчин и женщин. У них будет АБСОЛЮТНО равное среднее? Очевидно, нет, два числа с плавающей точкой не могут повторяться. Но тот факт, что у мужчин мира в среднем на 0,0000000345 выше , бессмыслен для практики. Плюс Через секунду кто-то умрет и кто-то родится новый, перевернув столь малые различия
А опросили на счёт чего?
источник

А[

Александр [capsula] in R language and Statistical data analysis
Может они и отличаются
источник

АР

Александр Райков in R language and Statistical data analysis
2) выборка никогда не набирается подлинно случайными, как предполагает проверка гипотезы. Сравниваются не мужчины с женщинами, а чуть-чуть больше перекошенные от нормы в сторону интеллекта женщины и чуть-чуть больше перекошенные в чёт-то другом мужики. Побочные переменные подхватываются и дают различия. А все не проконтролирует
источник

АР

Александр Райков in R language and Statistical data analysis
Александр [capsula]
А опросили на счёт чего?
На счёт чего угодно
источник

А[

Александр [capsula] in R language and Statistical data analysis
Александр Райков
На счёт чего угодно
А мэ и жэ в чем-то АБСОЛЮТНО одинаковые? Это просто философский вопрос
источник

АР

Александр Райков in R language and Statistical data analysis
Евгений Томилов
Он имеет же серьёзные проблемы с тем, что в реальной жизни рангов сравниваемых обычно немного. А когда они повторяются, всё плохо, недостоверно. Как минимум, я всегда так думал.
Это выдумка некоторых людей, которые всмотрелись в формулу и подумали, не соотнося с практикой
источник

АР

Александр Райков in R language and Statistical data analysis
Я пробовал ломать Манна-Уитни связанными рангами
источник

АР

Александр Райков in R language and Statistical data analysis
1) касается только ситуации, когда повторы в разных группах, а не в одной, 2) немножко отклоняет p лишь в той области, где оно заведомо незначимо
источник

АР

Александр Райков in R language and Statistical data analysis
В значимой роли не играет фактически
источник

А[

Александр [capsula] in R language and Statistical data analysis
Александр Райков
Я пробовал ломать Манна-Уитни связанными рангами
А вы ломали как? Бутстреппом? Многосотенными наборами? У меня действительно вопрос только один - почему большая выборка плохо?
источник

АР

Александр Райков in R language and Statistical data analysis
Александр [capsula]
А вы ломали как? Бутстреппом? Многосотенными наборами? У меня действительно вопрос только один - почему большая выборка плохо?
Искусственными данными с дофигищей ранговых связок
источник