Size: a a a

R language and Statistical data analysis

2019 December 18

PU

Philipp Upravitelev in R language and Statistical data analysis
когда у вас есть теоретическая модель (основанная на предыдущих исследованиях, например), которая говорит, что вот этот фактор (вот это сочетание) должно значимо отличаться от других - это проверка гипотезы

когда у вас есть опросник, в котором 16 шкал, и второй опросник, в котором 8 шкал, и вы делаете огромную таблицу корреляций, в надежде найти хоть какие-то значимые взаимосвязи, то я это называю поиском эффектов (может быть это по-другому называется)
источник

ЕТ

Евгений Томилов in R language and Statistical data analysis
Я же верно понимаю, что критерий хи-квадрата, фактически, просто вычисляет расстояние от ожидаемых частот до фактических, а потом смотрит, насколько редко такое расстояние встречается при текущих степенях свободы?
источник

PU

Philipp Upravitelev in R language and Statistical data analysis
угу
источник

PU

Philipp Upravitelev in R language and Statistical data analysis
насколько редко - смотрит по распределению хи-квадрат
источник

ЕТ

Евгений Томилов in R language and Statistical data analysis
Да, значит, всё верно, спасибо.
источник

АК

Артём Клевцов in R language and Statistical data analysis
Philipp Upravitelev
собственно, в мануалах по созданию презентаций в rmarkdawn так и рекомендуют - сделайте презу, а потом в chrome ее сконвертируйте в пдф
Это можно сделать прямо из R при помощи pagedown::chrome_print.
источник

A

A in R language and Statistical data analysis
Philipp Upravitelev
когда у вас есть теоретическая модель (основанная на предыдущих исследованиях, например), которая говорит, что вот этот фактор (вот это сочетание) должно значимо отличаться от других - это проверка гипотезы

когда у вас есть опросник, в котором 16 шкал, и второй опросник, в котором 8 шкал, и вы делаете огромную таблицу корреляций, в надежде найти хоть какие-то значимые взаимосвязи, то я это называю поиском эффектов (может быть это по-другому называется)
Да, такие примеры у меня и были в голове.

Но разве нет множества промежуточных состояний?

В социальных науках можно найти литературу под прямо противоположные гипотезы и особенно с теоретическим обоснованием. То есть можно любую точку зрения подкрепить.

В бизнесе можно сидеть предполагать "наверно на конверсию влияет. Нет, на nps. Нет, на LTV, нет, на время, проведенное в Х". И все это может казаться логичным, особенно после того, как предыдущее оказалось неподтвержденным.
источник

PU

Philipp Upravitelev in R language and Statistical data analysis
любой эксперимент это обеднение реальности до конкретной гипотезы.
и да, я не могу с вами согласиться ни по поводу соц.наук, ни по поводу бизнеса
источник

A

A in R language and Statistical data analysis
Что ж, хорошо)
Мне понятен принцип о котором, но привык себе не доверять и искать подводнве камни.
источник

PU

Philipp Upravitelev in R language and Statistical data analysis
одно другому не мешает, мне кажется
источник
2019 December 19

АК

Артём Клевцов in R language and Statistical data analysis
2019 R Community Survey

For the second consecutive year, RStudio is fielding this survey to better understand how people learn and use the R language. We encourage anyone who is interested in R to respond, regardless of whether they have learned the language. We will be accepting submissions through January 4, 2020, at which time the survey will close.

The survey should only require 5 to 10 minutes of your time, depending on how little or how much information you choose to share with us. We value your time and appreciate your input.

https://docs.google.com/forms/d/e/1FAIpQLScOunBI6pHZcGDyMoWFloISfdaoxvUkP6e6WP8eQAynGlyTPw/viewform?sfns=mo
источник

АК

Артём Клевцов in R language and Statistical data analysis
источник

А[

Александр [capsula] in R language and Statistical data analysis
Репорт - спам
источник

IV

Ilya Voropaev in R language and Statistical data analysis
Здравствуйте! Сделал кластеризацию данных базы Iris. И в последнем графике, где показано оптимальное число кластеров, по оси y идёт значения “Frequency among all indices” (Частота среди всех индексов). Никто не подскажет что именно это значит? Фото графика прикрепляю к сообщению
источник

IV

Ilya Voropaev in R language and Statistical data analysis
источник

AK

Alexey Kalugin in R language and Statistical data analysis
3 кластера оптимальны, судя по графику, он создан на основе пакета NbClust, в котором порядка 30 критериев "голосуют" за оптимум
источник

AK

Alexey Kalugin in R language and Statistical data analysis
По оси, соответственно, частота встречаемости такого количества кластеров, как оптимального
источник

IV

Ilya Voropaev in R language and Statistical data analysis
Понял. Спасибо большое!
источник

AK

Alexey Kalugin in R language and Statistical data analysis
Сам график строится с помощью пакета factoextra, там есть соответствующая функция
источник

AK

Alexey Kalugin in R language and Statistical data analysis
Обращающаяся к NbClust
источник