PD
Size: a a a
PD
AS
dplyr
сгруппировать *списки*?t1 = tribble(Приводит к "Error: Column
~x, ~sent,
"a", c(1,2,3),
"b", c(10,20,30),
"a", c(5,6,7),
"b", c(15,16,17),
"a", c(4,8,9),
)
t1 %>% group_by(x) %>% summarize_all(c)
sent
must be length 1 (a summary value), not 3"a c(1,2,3,5,6,7,4,8,9)
b c(10,20,30,15,16,17)
library(tibble)
> t1 = tribble(
+ ~x, ~sent,
+ "a", c(1,2,3),
+ "b", c(10,20,30),
+ "a", c(5,6,7),
+ "b", c(15,16,17),
+ "a", c(4,8,9),
+ )
> t1
# A tibble: 5 x 2
x sent
<chr> <list>
1 a <dbl [3]>
2 b <dbl [3]>
3 a <dbl [3]>
4 b <dbl [3]>
5 a <dbl [3]>
m
library(tibble)
> t1 = tribble(
+ ~x, ~sent,
+ "a", c(1,2,3),
+ "b", c(10,20,30),
+ "a", c(5,6,7),
+ "b", c(15,16,17),
+ "a", c(4,8,9),
+ )
> t1
# A tibble: 5 x 2
x sent
<chr> <list>
1 a <dbl [3]>
2 b <dbl [3]>
3 a <dbl [3]>
4 b <dbl [3]>
5 a <dbl [3]>
group_by(sentiment) %>% summarize_all(function(x) return(list(unlist(x))))
AS
AS
AS
AS
unnest_longer()
m
unnest_longer()
-- то, что надо!AS
unnest_longer()
-- то, что надо!library(tibble)
library(tidyr)
t1 = tribble(
~x, ~sent,
"a", c(1,2,3),
"b", c(10,20,30),
"a", c(5,6,7),
"b", c(15,16,17),
"a", c(4,8,9),
)
t1 %>% unnest_longer(sent)
В
steam_in
читает файл построчно и применяет callback-функцию. Чтение чанками позволяет избежать проблемы нехватки оперативной памяти, а сохранение результата работы callback-функции позволят сохранить результат работы при ошибки или отвале коннекта.AB
AB
AS
A
AB
AB
AB
AB
AS
AB