Size: a a a

R language and Statistical data analysis

2019 December 14

ЕТ

Евгений Томилов in R language and Statistical data analysis
novicer
как выбрать n самых крупных групп в dataframe?
Если 5 групп.

data %>% count(group) %>% arrange(desc(n)) %>% slice(5) %>% select(n) %>% unlist() -> tags_group

data %>% filter(group %in% tags_group) -> new_data


#darkwisard
источник

n

novicer in R language and Statistical data analysis
Евгений Томилов
Если 5 групп.

data %>% count(group) %>% arrange(desc(n)) %>% slice(5) %>% select(n) %>% unlist() -> tags_group

data %>% filter(group %in% tags_group) -> new_data


#darkwisard
я более-менее понимаю, что здесь написано, но у меня данный фрагмент не работает... никакой ошибки нет - просто происходит вылет Rstudio при выполнении последней строки. я новичёк в R
источник

ЕТ

Евгений Томилов in R language and Statistical data analysis
novicer
я более-менее понимаю, что здесь написано, но у меня данный фрагмент не работает... никакой ошибки нет - просто происходит вылет Rstudio при выполнении последней строки. я новичёк в R
Ну, ещё можно вручную написать
filter(group == "one_group', group == "two_group")

и так далее.
источник

n

novicer in R language and Statistical data analysis
Евгений Томилов
Ну, ещё можно вручную написать
filter(group == "one_group', group == "two_group")

и так далее.
а есть другой способ автоматизировать этот процесс?
источник

ЕТ

Евгений Томилов in R language and Statistical data analysis
novicer
а есть другой способ автоматизировать этот процесс?
Наверняка есть, попробуйте сделать запрос вроде "get n biggest group from dataset in R"
источник

n

novicer in R language and Statistical data analysis
по крайней мере я нашёл только ответы на вопросы "как найти максимальные элементы в каждой группе", а не сами группы
источник

ЕТ

Евгений Томилов in R language and Statistical data analysis
novicer
по крайней мере я нашёл только ответы на вопросы "как найти максимальные элементы в каждой группе", а не сами группы
Смотрите, суть в том, что вам надо сначала сделать таблицу размеров каждой группы, взять из неё n групп с наибольшими размерами.
Потом нужно отфильтровать датасет по группирующей переменной, оставив в ней только необходимые значения.
источник

V

Violet in R language and Statistical data analysis
Kirill Tsaregorodtsev
На либгене есть наверняка
Да, нашла 2003 издание на либгене. Или где-то есть новее?
источник

n

novicer in R language and Statistical data analysis
Евгений Томилов
Смотрите, суть в том, что вам надо сначала сделать таблицу размеров каждой группы, взять из неё n групп с наибольшими размерами.
Потом нужно отфильтровать датасет по группирующей переменной, оставив в ней только необходимые значения.
с 1 пунктом я разобрался вот так
источник

KT

Kirill Tsaregorodtsev in R language and Statistical data analysis
Наверное вряд ли, автор до 2003 года умер
источник

ЕТ

Евгений Томилов in R language and Statistical data analysis
Violet
Да, нашла 2003 издание на либгене. Или где-то есть новее?
Нет, это последнее переиздание...
источник

V

Violet in R language and Statistical data analysis
Как жаль( судя по всему, очень хорошая прикладная книга.
источник

ЕТ

Евгений Томилов in R language and Statistical data analysis
Violet
Как жаль( судя по всему, очень хорошая прикладная книга.
Это шедевр, только ради неё учу английский.
источник

V

Violet in R language and Statistical data analysis
Мне чем-то Ширяева напомнила...
источник

n

novicer in R language and Statistical data analysis
почему вот этот фрагмент не работает?
источник

KT

Kirill Tsaregorodtsev in R language and Statistical data analysis
Странно, что Ширяева. Книгу Джейнса я читал не полностью, но мне казалось, что она философски-гносеологическая в каком-то смысле, в то время как Ширяев вообще не интересуется связью с реальностью и изучает вероятность как вещь в себе. Но может это поверхностный взгляд на обе книги
источник

V

Violet in R language and Statistical data analysis
Да, именно центральным взглядом и напомнила. В отличие от обычных учебников по теорверу.
источник

V

Violet in R language and Statistical data analysis
Ширяев безусловно менее прикладной
источник

n

novicer in R language and Statistical data analysis
хочу построить гистограмму распределения между категориальными данными (профессиями) и номинальными (средним уровнем зарплат). можете, пожалуйста, подсобить - не понимаю как написать это в R...
источник

n

novicer in R language and Statistical data analysis
на скрине - моя попытка, но безуспешная, очевидно
источник