Телеграмм чат группы rlang

Тут скорее можно сказать, что, чем меньше выборка, тем меньше вероятность, что параметры приближающего её распределения будут соответствовать параметрам распределения генеральной совокупности.

источник

22:01пожаловаться #10

А[

Александр [capsula] in R language and Statistical data analysis

Так или иначе не понимаю, почему многосотенные датасеты плохи

источник

22:01пожаловаться #11

ЕТ

Евгений Томилов in R language and Statistical data analysis

Александр [capsula]

Так или иначе не понимаю, почему многосотенные датасеты плохи

Они хороши, но надо быть более острожным и понимать, какой размер эффекта мы ищем. На 100000 выборке найдётся и очень незначительный по размеру эффект, который как бы и есть "на самом деле", но по факту является чем-то вроде "ели в среднем на 0.0001 миллиметр выше берез".

источник

22:03пожаловаться #12

A

Andrey in R language and Statistical data analysis

Александр [capsula]

Так или иначе не понимаю, почему многосотенные датасеты плохи

да все с ними хорошо

источник

22:03пожаловаться #13

А[

Александр [capsula] in R language and Statistical data analysis

Евгений Томилов

Они хороши, но надо быть более острожным и понимать, какой размер эффекта мы ищем. На 100000 выборке найдётся и очень незначительный по размеру эффект, который как бы и есть "на самом деле", но по факту является чем-то вроде "ели в среднем на 0.0001 миллиметр выше берез".

Ну так дело в размере эффекта, да

источник

22:03пожаловаться #14

ЕТ

Евгений Томилов in R language and Statistical data analysis

Андрей выше всё верно говорит.

источник

22:03пожаловаться #15

А[

Александр [capsula] in R language and Statistical data analysis

Если такой размер интересует и он есть, найдется (или нет)

источник

22:04пожаловаться #16

A

Andrey in R language and Statistical data analysis

Евгений Томилов

Тут скорее можно сказать, что, чем меньше выборка, тем меньше вероятность, что параметры приближающего её распределения будут соответствовать параметрам распределения генеральной совокупности.

более того, на маленькой выборке вообще можно не понять, какую форму имеет распределение и какие параметры его корректно описывают

источник

22:04пожаловаться #17

ЕТ

Евгений Томилов in R language and Statistical data analysis

Andrey

более того, на маленькой выборке вообще можно не понять, какую форму имеет распределение и какие параметры его корректно описывают

+++

источник

22:04пожаловаться #18

А[

Александр [capsula] in R language and Statistical data analysis

А это к Александру скорее вопрос

источник

22:04пожаловаться #19

A

Andrey in R language and Statistical data analysis

Это все проблемы репрезентативности, если точно знаешь, что в генеральной совокупности гауссиана, то это одно, а если распределение мультимодальное и с тяжелыми хвостами, то надо все участки этой кривули покрыть хоть каким-то количеством наблюдений

источник

22:05пожаловаться #20