Телеграмм чат группы rlang

2019 December 14

ЕТ

Евгений Томилов in R language and Statistical data analysis

novicer

как выбрать n самых крупных групп в dataframe?

Если 5 групп.

data %>% count(group) %>% arrange(desc(n)) %>% slice(5) %>% select(n) %>% unlist() -> tags_group

data %>% filter(group %in% tags_group) -> new_data

#darkwisard

источник

16:48пожаловаться #1

n

novicer in R language and Statistical data analysis

Евгений Томилов

Если 5 групп.

data %>% count(group) %>% arrange(desc(n)) %>% slice(5) %>% select(n) %>% unlist() -> tags_group

data %>% filter(group %in% tags_group) -> new_data

#darkwisard

я более-менее понимаю, что здесь написано, но у меня данный фрагмент не работает... никакой ошибки нет - просто происходит вылет Rstudio при выполнении последней строки. я новичёк в R

источник

16:52пожаловаться #2

ЕТ

Евгений Томилов in R language and Statistical data analysis

novicer

я более-менее понимаю, что здесь написано, но у меня данный фрагмент не работает... никакой ошибки нет - просто происходит вылет Rstudio при выполнении последней строки. я новичёк в R

Ну, ещё можно вручную написать

filter(group == "one_group', group == "two_group")

и так далее.

источник

16:54пожаловаться #3

n

novicer in R language and Statistical data analysis

Евгений Томилов

Ну, ещё можно вручную написать

filter(group == "one_group', group == "two_group")

и так далее.

а есть другой способ автоматизировать этот процесс?

источник

16:56пожаловаться #4

ЕТ

Евгений Томилов in R language and Statistical data analysis

novicer

а есть другой способ автоматизировать этот процесс?

Наверняка есть, попробуйте сделать запрос вроде "get n biggest group from dataset in R"

источник

16:59пожаловаться #5

n

novicer in R language and Statistical data analysis

по крайней мере я нашёл только ответы на вопросы "как найти максимальные элементы в каждой группе", а не сами группы

источник

17:01пожаловаться #6

ЕТ

Евгений Томилов in R language and Statistical data analysis

novicer

по крайней мере я нашёл только ответы на вопросы "как найти максимальные элементы в каждой группе", а не сами группы

Смотрите, суть в том, что вам надо сначала сделать таблицу размеров каждой группы, взять из неё n групп с наибольшими размерами.
Потом нужно отфильтровать датасет по группирующей переменной, оставив в ней только необходимые значения.

источник

17:07пожаловаться #7

V

Violet in R language and Statistical data analysis

Kirill Tsaregorodtsev

На либгене есть наверняка

Да, нашла 2003 издание на либгене. Или где-то есть новее?

источник

17:07пожаловаться #8

n

novicer in R language and Statistical data analysis

Евгений Томилов

Смотрите, суть в том, что вам надо сначала сделать таблицу размеров каждой группы, взять из неё n групп с наибольшими размерами.
Потом нужно отфильтровать датасет по группирующей переменной, оставив в ней только необходимые значения.

с 1 пунктом я разобрался вот так

источник

17:14пожаловаться #9

KT

Kirill Tsaregorodtsev in R language and Statistical data analysis

Наверное вряд ли, автор до 2003 года умер

источник

17:16пожаловаться #10

ЕТ

Евгений Томилов in R language and Statistical data analysis

Violet

Да, нашла 2003 издание на либгене. Или где-то есть новее?

Нет, это последнее переиздание...

источник

17:17пожаловаться #11

V

Violet in R language and Statistical data analysis

Как жаль( судя по всему, очень хорошая прикладная книга.

источник

17:17пожаловаться #12

ЕТ

Евгений Томилов in R language and Statistical data analysis

Violet

Как жаль( судя по всему, очень хорошая прикладная книга.

Это шедевр, только ради неё учу английский.

источник

17:18пожаловаться #13

V

Violet in R language and Statistical data analysis

Мне чем-то Ширяева напомнила...

источник

17:18пожаловаться #14

n

novicer in R language and Statistical data analysis

почему вот этот фрагмент не работает?

источник

17:22пожаловаться #15

KT

Kirill Tsaregorodtsev in R language and Statistical data analysis

Странно, что Ширяева. Книгу Джейнса я читал не полностью, но мне казалось, что она философски-гносеологическая в каком-то смысле, в то время как Ширяев вообще не интересуется связью с реальностью и изучает вероятность как вещь в себе. Но может это поверхностный взгляд на обе книги

источник

17:39пожаловаться #16

V

Violet in R language and Statistical data analysis

Да, именно центральным взглядом и напомнила. В отличие от обычных учебников по теорверу.

источник

17:41пожаловаться #17

V

Violet in R language and Statistical data analysis

Ширяев безусловно менее прикладной

источник

17:42пожаловаться #18

n

novicer in R language and Statistical data analysis

хочу построить гистограмму распределения между категориальными данными (профессиями) и номинальными (средним уровнем зарплат). можете, пожалуйста, подсобить - не понимаю как написать это в R...

источник

18:47пожаловаться #19

n

novicer in R language and Statistical data analysis

на скрине - моя попытка, но безуспешная, очевидно

источник

18:48пожаловаться #20