Size: a a a

R language and Statistical data analysis

2017 October 12

PU

Philipp Upravitelev in R language and Statistical data analysis
ntimes <- 100
test <- data.table(
 group_id = rep(c('blue', 'green', 'red', 'black'), each = ntimes),
 event = sample(c('tg1', 'tg2', 'tg3'), ntimes * 4, replace = TRUE),
 ts = rep(seq(Sys.Date() - ntimes + 1, Sys.Date(), 1), 4))

test[, list(var = sum(event[ts %between% c('2017-09-01', '2017-09-15')] == 'tg1')), by = group_id]
источник

ЕТ

Евгений Томилов in R language and Statistical data analysis
Пока в процессе. Через два года ворвусь в этот мир. Спасибо за поддержку даже если это не было ей.
источник

A

Alexandr M in R language and Statistical data analysis
источник

Ю

Юрий 🐙💻🤖📊📈🚬 in R language and Statistical data analysis
Philipp Upravitelev
ntimes <- 100
test <- data.table(
 group_id = rep(c('blue', 'green', 'red', 'black'), each = ntimes),
 event = sample(c('tg1', 'tg2', 'tg3'), ntimes * 4, replace = TRUE),
 ts = rep(seq(Sys.Date() - ntimes + 1, Sys.Date(), 1), 4))

test[, list(var = sum(event[ts %between% c('2017-09-01', '2017-09-15')] == 'tg1')), by = group_id]
library(dplyr)
test %>%
 filter(event == "tg1" & ts %between% c('2017-09-01', '2017-09-15')) %>%
 group_by(group_id) %>%
 count()
источник

PU

Philipp Upravitelev in R language and Statistical data analysis
а теперь представим, что таких окон штук 20. и не всегда count.
источник

PU

Philipp Upravitelev in R language and Statistical data analysis
в общем-то, что дт, что дплир, один чорт
источник

PU

Philipp Upravitelev in R language and Statistical data analysis
а пайпы вроде замедляют код, не?
источник

A

Andrey in R language and Statistical data analysis
да
источник

A

Andrey in R language and Statistical data analysis
и оверхед по памяти создают
источник

A

Andrey in R language and Statistical data analysis
был даже пакет, который раскручивает пайп во вложенные функции
источник

Ю

Юрий 🐙💻🤖📊📈🚬 in R language and Statistical data analysis
Philipp Upravitelev
а теперь представим, что таких окон штук 20. и не всегда count.
завернуть в функцию, аргументами которой будут датафрейм и даты
источник

PU

Philipp Upravitelev in R language and Statistical data analysis
оно и так будет в большой функции :)
источник

PU

Philipp Upravitelev in R language and Statistical data analysis
я про то, что ве равно лапша получается
источник

PU

Philipp Upravitelev in R language and Statistical data analysis
надо будет попробовать функцию
как минимум, читаемость получше может быть
источник

JS

Jury Sergeev in R language and Statistical data analysis
что же, не юзать пайпы на проде
источник

Ю

Юрий 🐙💻🤖📊📈🚬 in R language and Statistical data analysis
не знаю, для моих проектов как-то не заметил замедления и оверхеда памяти
источник

JS

Jury Sergeev in R language and Statistical data analysis
раз быстрее
источник

Ю

Юрий 🐙💻🤖📊📈🚬 in R language and Statistical data analysis
ну, может быть что у меня датасеты не более 300-500 переменных и 10 тыс. наблюдений в основном
источник

JS

Jury Sergeev in R language and Statistical data analysis
надо будет сравнить на молотилке логов
источник

Ю

Юрий 🐙💻🤖📊📈🚬 in R language and Statistical data analysis
источник