Size: a a a

R language and Statistical data analysis

2020 February 18

АР

Александр Райков in R language and Statistical data analysis
а ещё бывает взаимодействие пола с чем-нибудь важным 😁
источник

АР

Александр Райков in R language and Statistical data analysis
и вот при добавлении членов взаимодействия несбалансированная выборка приводит к корреляции взаимодействия с одним из порождающих его эффектов, и отъеданию значимости у последнего (если не использовать II тип суммы квадратов)
источник

R

R in R language and Statistical data analysis
Наверное, если платить, дисбаланс пропадет
источник

DN

Denis Naumov in R language and Statistical data analysis
Друзья, помогите подсчитать О большое для алгоритма медианного сгалживания с окном n  в ряду длиной T, написано что нужно самый эффективный алгоритм использовать в плане производительности. Размер окна медианного сглаживания определяется как 2m+1 самым простым алгоритмом в таком случае будет тот где m=1. Т.е. длина окна будет равна 3-м.  В таком случае кол-во окон будет равно  T - (2 (1) +1).  А кол-во всех вычислений как 2m+1*2  так как надо сделать 2 итерации чтобы найти медиану. И Получается что всего будет  T-(2*(1)-1) * 2*(2(1)+1) = T-1*6 т.е. О большое равно О(Т). Я только осваиваю это дело подскажите правильно ли я считал это дело
источник

AA

A.K. A.K. in R language and Statistical data analysis
Евгений Томилов
Ну, я хочу перепроверить собственную выборку в магистерской. У меня 404 человека было, из них 244 женщины. Выборка в России набиралась (52% женщин в ней по последним данным). И мне сейчас утверждает один человек, что вероятность набрать случайно такую выборку составляет 0.000001 процент. Я хочу понять, в чём он не прав или прав.
Мне кажется коллега не прав. Если берём перепись 2019 года, то доля мужчин идёт 46,2%. У вас в выборке 49,5%. У нас 95%доверительный интервал получается +- 4,86%...следовательно всё нормально, если я правильно посчитал (просто делал всё быстро руками)
источник

АР

Александр Райков in R language and Statistical data analysis
A.K. A.K.
Мне кажется коллега не прав. Если берём перепись 2019 года, то доля мужчин идёт 46,2%. У вас в выборке 49,5%. У нас 95%доверительный интервал получается +- 4,86%...следовательно всё нормально, если я правильно посчитал (просто делал всё быстро руками)
С чего такой огроменный доверительный интервал?
источник

AA

A.K. A.K. in R language and Statistical data analysis
Так получилось, руками считал... Кстати нашёл аналогичный пример, по которому и считал
источник

AA

A.K. A.K. in R language and Statistical data analysis
источник

AA

A.K. A.K. in R language and Statistical data analysis
источник

AA

A.K. A.K. in R language and Statistical data analysis
Тока последний скрин первый как бы
источник

ГД

Григорий Демин in R language and Statistical data analysis
Евгений Томилов
Ну, я хочу перепроверить собственную выборку в магистерской. У меня 404 человека было, из них 244 женщины. Выборка в России набиралась (52% женщин в ней по последним данным). И мне сейчас утверждает один человек, что вероятность набрать случайно такую выборку составляет 0.000001 процент. Я хочу понять, в чём он не прав или прав.
Ну это точно значимое отличие от 52%
источник

АР

Александр Райков in R language and Statistical data analysis
Григорий Демин
Ну это точно значимое отличие от 52%
Не стоит так делать, хи-квадрат без коррекций к 1 степени свободы даёт искажения
источник

АР

Александр Райков in R language and Statistical data analysis
Поэтому и есть биномиальный
источник

АР

Александр Райков in R language and Statistical data analysis
Я сейчас думаю, где логическая ошибка в проверке по Стьюденту для генеральной доли, которую в социологическом учебнике применяли. Интересный кейс на разогрев мозгов
источник

ЕТ

Евгений Томилов in R language and Statistical data analysis
Надо бы найти бакалавриат по статистике удалённый и поучиться там.
источник

ГД

Григорий Демин in R language and Statistical data analysis
Александр Райков
Не стоит так делать, хи-квадрат без коррекций к 1 степени свободы даёт искажения
Там же есть поравка
источник

АР

Александр Райков in R language and Statistical data analysis
А, сорри
источник

АР

Александр Райков in R language and Statistical data analysis
Эм. А что подставлялось взамен 10000? Население России?
источник

AA

A.K. A.K. in R language and Statistical data analysis
Проп тест разве не вероятность удачи рассчитывает, когда мы предполагаем дов интервал
источник

AA

A.K. A.K. in R language and Statistical data analysis
Как бы он здесь не очень вроде
источник