Size: a a a

R language and Statistical data analysis

2020 January 16

P

Pchlq in R language and Statistical data analysis
Groupby
источник

AS

Alexander Semenov in R language and Statistical data analysis
Group by, cruel world, group by...
источник

PU

Philipp Upravitelev in R language and Statistical data analysis
Максим
У меня имеется таблица в одном столбце даты, в другом столбце одно из двух значений, как мне посчитать по годам значения? То есть мне нужно просуммировать значения по годам.
а как вы гуглили этот вопрос?
источник

A

Alexander (AlexR) in R language and Statistical data analysis
@PeWpIC ,
aggregatre()
вам в помощь)
источник

М

Максим in R language and Statistical data analysis
Philipp Upravitelev
а как вы гуглили этот вопрос?
я нашел group_by но как то странно работает, либо я не понимаю как он должен работать в R.
источник

PU

Philipp Upravitelev in R language and Statistical data analysis
код покажите
источник

М

Максим in R language and Statistical data analysis
test <- group_by(netflix_bd["type"], year = format(netflix_bd$date_added, "%Y"))
По сути это лишь сцепляет таблицу с добавленным столбцом year. Я понимаю что мне нужно сгруппировать по году, но столбце может быть одно из двух значений, значит мне нужно их как то разъединить и посчитать
источник

PU

Philipp Upravitelev in R language and Statistical data analysis
Максим
test <- group_by(netflix_bd["type"], year = format(netflix_bd$date_added, "%Y"))
По сути это лишь сцепляет таблицу с добавленным столбцом year. Я понимаю что мне нужно сгруппировать по году, но столбце может быть одно из двух значений, значит мне нужно их как то разъединить и посчитать
> library(dplyr)
> tbl <- tibble(
+   var1 = rep(c('a', 'b'), 3),
+   var2 = sample(6)
+ )
>
> tbl <- tbl %>%
+   group_by(var1) %>%
+   summarize(var2_mn = mean(var2))
> tbl
# A tibble: 2 x 2
 var1  var2_mn
 <chr>   <dbl>
1 a        4.67
2 b        2.33
источник

М

Максим in R language and Statistical data analysis
Philipp Upravitelev
> library(dplyr)
> tbl <- tibble(
+   var1 = rep(c('a', 'b'), 3),
+   var2 = sample(6)
+ )
>
> tbl <- tbl %>%
+   group_by(var1) %>%
+   summarize(var2_mn = mean(var2))
> tbl
# A tibble: 2 x 2
 var1  var2_mn
 <chr>   <dbl>
1 a        4.67
2 b        2.33
а почему если я поставлю в последнем выражении вместо tbl <- ..., например t <-, то значения будут другими?
источник

PU

Philipp Upravitelev in R language and Statistical data analysis
потому что у меня sample(), случайная генерация значений. у вас будут другие значения
если хотите полностью повторить код, то в создании фрейма напишите в var2 свой вектор вместо sample(), например, 1:6
источник

М

Максим in R language and Statistical data analysis
Понял
источник

PU

Philipp Upravitelev in R language and Statistical data analysis
Максим
Понял
> library(dplyr)
> tbl <- tibble(
+   var1 = rep(c('a', 'b'), 3),
+   var2 = 1:6
+ )
>
> tbl <- tbl %>%
+   group_by(var1) %>%
+   summarize(var2_mn = mean(var2))
> tbl
# A tibble: 2 x 2
 var1  var2_mn
 <chr>   <dbl>
1 a           3
2 b           4
источник

Ю

Юрий 🐙💻🤖📊📈🚬 in R language and Statistical data analysis
Минутка юмоRа
источник

PU

Philipp Upravitelev in R language and Statistical data analysis
норм
источник

PU

Philipp Upravitelev in R language and Statistical data analysis
кто будет сегодня на митапе?
источник

э

эдуард in R language and Statistical data analysis
Philipp Upravitelev
кто будет сегодня на митапе?
+
источник

A

Alеx 🤼‍♂️ in R language and Statistical data analysis
+
источник

PU

Philipp Upravitelev in R language and Statistical data analysis
отлично. я, видимо, приеду часам к семи, не раньше
источник

Д

Дима in R language and Statistical data analysis
При прохождении авторизации для пакета googlesheets  выскакивает ошибка "Вход с аккаунтом Google временно заблокирован для этого приложения". Кто-то сталкивался с подобным?  http://prntscr.com/qomebz
источник

PD

Pavel Demin in R language and Statistical data analysis
Philipp Upravitelev
кто будет сегодня на митапе?
+
источник