Size: a a a

R language and Statistical data analysis

2020 February 18

R

R in R language and Statistical data analysis
Евгений Томилов
Ну, я хочу перепроверить собственную выборку в магистерской. У меня 404 человека было, из них 244 женщины. Выборка в России набиралась (52% женщин в ней по последним данным). И мне сейчас утверждает один человек, что вероятность набрать случайно такую выборку составляет 0.000001 процент. Я хочу понять, в чём он не прав или прав.
отсюда :D
источник

R

R in R language and Statistical data analysis
не проверял
источник

ЕТ

Евгений Томилов in R language and Statistical data analysis
Их уже 54%, кстати.
источник

ЕТ

Евгений Томилов in R language and Statistical data analysis
Александр Райков
А вот это тонкий момент. Можно сказать, мол, у меня в исследовании не изучается религиозная принадлежность, нафига мне относительно неё репрезентативность. А в популяции религия увязана с каким-то изучаемым в исследовании фактором (допустим, у мусульман более ранние браки), и оно начинает себя опосредованно проявлять в собранных данных
Вообще, именно в моём исследовании пол не причём, там низкоуровневая штука, на которую пол не должен никак влиять, да и то, все подвыборки были по нему уравновешены (случайно получилось, лол) и всё такое.
источник

АР

Александр Райков in R language and Statistical data analysis
Ээээ
источник

АР

Александр Райков in R language and Statistical data analysis
Если все подвыборки сбалансированы по полу, то откуда половой перевес в целом?
источник

ЕТ

Евгений Томилов in R language and Statistical data analysis
Александр Райков
Если все подвыборки сбалансированы по полу, то откуда половой перевес в целом?
Они уравновешены на в смысле "идеальная пропорция", а в смысле, что не было существенных различий между группами экспериментальными по полу.
источник

АР

Александр Райков in R language and Statistical data analysis
ну тут скорее методологический вопрос, что если выборка набиралась таким образом, что в ней оказалось намного больше женщин, то значит, она явно отошла от случайной, и не исказилось ли тогда что-нибудь ещё. Независимо от того, как влияет пол
источник

R

R in R language and Statistical data analysis
(и пол скорее всего все равно влияет)
источник

ЕТ

Евгений Томилов in R language and Statistical data analysis
Александр Райков
ну тут скорее методологический вопрос, что если выборка набиралась таким образом, что в ней оказалось намного больше женщин, то значит, она явно отошла от случайной, и не исказилось ли тогда что-нибудь ещё. Независимо от того, как влияет пол
На самом деле такое ощущение складывается, что женщин, доступных для исследований, не 54% в России, а все 95%. Как бы случайно не набирал, получается, что либо надо тогда стратификацию сразу вводить, либо страдать, поскольку женский пол идёт на всё, а мужской сидит и не хочет ни в чём участвовать.
источник

ЕТ

Евгений Томилов in R language and Statistical data analysis
R
(и пол скорее всего все равно влияет)
Нет, не влияет. Как минимум, модель говорит, что не влияет. 😄
источник

АР

Александр Райков in R language and Statistical data analysis
Евгений Томилов
Нет, не влияет. Как минимум, модель говорит, что не влияет. 😄
Сколько p-значение?
источник

R

R in R language and Statistical data analysis
Евгений Томилов
На самом деле такое ощущение складывается, что женщин, доступных для исследований, не 54% в России, а все 95%. Как бы случайно не набирал, получается, что либо надо тогда стратификацию сразу вводить, либо страдать, поскольку женский пол идёт на всё, а мужской сидит и не хочет ни в чём участвовать.
А подопытным платили?
источник

АР

Александр Райков in R language and Statistical data analysis
Евгений Томилов
На самом деле такое ощущение складывается, что женщин, доступных для исследований, не 54% в России, а все 95%. Как бы случайно не набирал, получается, что либо надо тогда стратификацию сразу вводить, либо страдать, поскольку женский пол идёт на всё, а мужской сидит и не хочет ни в чём участвовать.
Ну нормальное следствие большей социальности женщин
источник

ЕТ

Евгений Томилов in R language and Statistical data analysis
R
А подопытным платили?
Нет.
источник

ЕТ

Евгений Томилов in R language and Statistical data analysis
Александр Райков
Сколько p-значение?
Я не помню, если честно, но предиктор так или иначе оказывался незначимым.
источник

АР

Александр Райков in R language and Statistical data analysis
ну понимаешь, p=0,051 c выводом "Ура, незначимо!" (здесь, конечно, чаще хотят "Ну почти что значимо же, да, давайте уровень значимости до 0,1 ослабим) - это на предмет доверия существенно хуже, чем p=0,984
источник

АР

Александр Райков in R language and Statistical data analysis
про силу эффекта не спрашиваю, выборка всё-таки многосотенная, но тоже не многотысячная
источник

ЕТ

Евгений Томилов in R language and Statistical data analysis
Александр Райков
ну понимаешь, p=0,051 c выводом "Ура, незначимо!" (здесь, конечно, чаще хотят "Ну почти что значимо же, да, давайте уровень значимости до 0,1 ослабим) - это на предмет доверия существенно хуже, чем p=0,984
Не, я не такой.
источник

ЕТ

Евгений Томилов in R language and Statistical data analysis
Александр Райков
про силу эффекта не спрашиваю, выборка всё-таки многосотенная, но тоже не многотысячная
К сожалению, да.
источник