Size: a a a

R language and Statistical data analysis

2020 January 13

АК

Артём Клевцов in R language and Statistical data analysis
Кстати, @konhis, а зачем оно вообще считается? Чего-то впаривать хотите или балансить сессии? Возможно цель метрики «подскажет» её правильное содержание.
источник

PU

Philipp Upravitelev in R language and Statistical data analysis
Дмитрий Козлов
Хорошо, х - количество "зачтено", у - количество "не зачтено". (х-у)/x вполне интерпретируемо. 1 - все "зачтено", 0 - одинаковое количество зачтено и не зачтено, отрицательные значения - больше не зачтено. Да и сами числа вполне осмысленны и отражают разницу.
хм. не соглашусь про зачтено/не зачтено
но в целом ты прав, можно и так сделать
источник

ГД

Григорий Демин in R language and Statistical data analysis
Philipp Upravitelev
привычкой. и понятными интерпретациями
например, когда кд ~ 10, это показывает, что игрок хорошо играет
когда около 0.1 - что плохо
x - y можно схожим образом интерпретировать, но с нюансами

а вот x / (1 - y) уже непонятно как интерпретировать
Разность все-таки как-то странно выглядит... Игрок, который умер 10 раз, убил 110 раз очевидно играет лучше, чем игрок, который умер 1010 и убил 1110, однако в данной метрике они одинаковы
источник

PU

Philipp Upravitelev in R language and Statistical data analysis
Артём Клевцов
Кстати, @konhis, а зачем оно вообще считается? Чего-то впаривать хотите или балансить сессии? Возможно цель метрики «подскажет» её правильное содержание.
сравнить две группы, у одних боты посильнее, у других посложнее
и понять, есть ли разница между группами / конфигами ботов. и какая это разница, что получают пользователи при разных конфигах
источник

PU

Philipp Upravitelev in R language and Statistical data analysis
Григорий Демин
Разность все-таки как-то странно выглядит... Игрок, который умер 10 раз, убил 110 раз очевидно играет лучше, чем игрок, который умер 1010 и убил 1110, однако в данной метрике они одинаковы
да, поэтому обычно и смотрим и отношение, и абсолютные значения
источник

ДК

Дмитрий Козлов in R language and Statistical data analysis
Григорий Демин
Разность все-таки как-то странно выглядит... Игрок, который умер 10 раз, убил 110 раз очевидно играет лучше, чем игрок, который умер 1010 и убил 1110, однако в данной метрике они одинаковы
О чем и речь, нужна какая-то нормировка
источник

PU

Philipp Upravitelev in R language and Statistical data analysis
Дмитрий Козлов
О чем и речь, нужна какая-то нормировка
говорю ж, обычно нормируем x / y
просто сейчас в y оказалось много нулей
источник

АК

Артём Клевцов in R language and Statistical data analysis
Philipp Upravitelev
говорю ж, обычно нормируем x / y
просто сейчас в y оказалось много нулей
Ботов на помойку, раз никто не умирает 😁
источник

PU

Philipp Upravitelev in R language and Statistical data analysis
нормально, это первый бой, там нельзя пугать совсем хардкором
источник

ДК

Дмитрий Козлов in R language and Statistical data analysis
Philipp Upravitelev
говорю ж, обычно нормируем x / y
просто сейчас в y оказалось много нулей
Я понимаю, да, именно так. Просто самое очевидное и первое приходящее на ум решение в данном случае - использовать вместо x/y y/x, если х=0 намного меньше.
источник

PU

Philipp Upravitelev in R language and Statistical data analysis
угу
источник

R

R in R language and Statistical data analysis
Дмитрий Козлов
Я понимаю, да, именно так. Просто самое очевидное и первое приходящее на ум решение в данном случае - использовать вместо x/y y/x, если х=0 намного меньше.
так это ведь по сути не решает проблему, нет? y/x при y=0 равно нулю для любых x, что не сильно лучше x/y, который в таком случае NA
источник

PU

Philipp Upravitelev in R language and Statistical data analysis
R
так это ведь по сути не решает проблему, нет? y/x при y=0 равно нулю для любых x, что не сильно лучше x/y, который в таком случае NA
если inf/na небольшое количество, мы их просто можем удалить
но не когда их до четверти выборки
источник

R

R in R language and Statistical data analysis
Philipp Upravitelev
если inf/na небольшое количество, мы их просто можем удалить
но не когда их до четверти выборки
иметь K/D, не чувствительную к K для четверти выборки, не сильно лучше, я к этому :D
источник

PU

Philipp Upravitelev in R language and Statistical data analysis
о, коллеги. раз уж все тут активные
как посчитать т-тест по статистикам, а не по сырым данным? может, кто знает функцию?
навскидку функции такой не знаю, самому писать лень, гугл тоже не особо помогает и спамит t.test()-ом
источник

ГД

Григорий Демин in R language and Statistical data analysis
Philipp Upravitelev
если inf/na небольшое количество, мы их просто можем удалить
но не когда их до четверти выборки
Вообще, если бы это была пропорция, то можно было бы добавлять к числителю и знаменателю параметры из априорного бета-распредления. Это вполне научная практика - http://varianceexplained.org/r/empirical_bayes_baseball/. Поправка лапласа - это своего рода частный случай. Но здесь отношение двух пуассонов - я не знаю, как для этого случая рассчитать поправки
источник

ГД

Григорий Демин in R language and Statistical data analysis
Philipp Upravitelev
о, коллеги. раз уж все тут активные
как посчитать т-тест по статистикам, а не по сырым данным? может, кто знает функцию?
навскидку функции такой не знаю, самому писать лень, гугл тоже не особо помогает и спамит t.test()-ом
А стандартное отклонение и средние есть?
источник

PU

Philipp Upravitelev in R language and Statistical data analysis
есть
источник

PU

Philipp Upravitelev in R language and Statistical data analysis
Григорий Демин
Вообще, если бы это была пропорция, то можно было бы добавлять к числителю и знаменателю параметры из априорного бета-распредления. Это вполне научная практика - http://varianceexplained.org/r/empirical_bayes_baseball/. Поправка лапласа - это своего рода частный случай. Но здесь отношение двух пуассонов - я не знаю, как для этого случая рассчитать поправки
оу. спасибо, буду смотреть. любопытная штука.
источник

ГД

Григорий Демин in R language and Statistical data analysis
expss::compare_means
источник