Size: a a a

R language and Statistical data analysis

2019 December 14

ЕТ

Евгений Томилов in R language and Statistical data analysis
novicer
хочу построить гистограмму распределения между категориальными данными (профессиями) и номинальными (средним уровнем зарплат). можете, пожалуйста, подсобить - не понимаю как написать это в R...
Можете показать картинкой аналог, что хотите?
источник

n

novicer in R language and Statistical data analysis
Евгений Томилов
Можете показать картинкой аналог, что хотите?
я представляю себе это так:
источник

n

novicer in R language and Statistical data analysis
в столбце Household.Head.Occupation - профессии, в Total.Household.Income - доходы. я хочу посмотреть их зависимость
источник

ЕТ

Евгений Томилов in R language and Statistical data analysis
novicer
я представляю себе это так:
Попробуйте загуглить geom_bar из ggplot2. Там есть примеры.
источник

A

Alexander (AlexR) in R language and Statistical data analysis
ggplot(data=df) + geom_bar(aes(x = var, y = id), stat = 'identity') + theme_bw()
источник

Ю

Юрий 🐙💻🤖📊📈🚬 in R language and Statistical data analysis
Alexander (AlexR)
ggplot(data=df) + geom_bar(aes(x = var, y = id), stat = 'identity') + theme_bw()
У автора траблы со структурой данных в исходном датасете
источник

Ю

Юрий 🐙💻🤖📊📈🚬 in R language and Statistical data analysis
novicer
хочу построить гистограмму распределения между категориальными данными (профессиями) и номинальными (средним уровнем зарплат). можете, пожалуйста, подсобить - не понимаю как написать это в R...
На будущее: читаем правила чата в закрепе, постить скрины кода это моветон
источник

n

novicer in R language and Statistical data analysis
да, простите, но я действительно не понимаю - почему вот этот код не работает: https://pastebin.com/GvDnf7xX . я использую geom_bar согласно инструкции, и группировка данных у меня происходит нормально...
источник

Ю

Юрий 🐙💻🤖📊📈🚬 in R language and Statistical data analysis
novicer
да, простите, но я действительно не понимаю - почему вот этот код не работает: https://pastebin.com/GvDnf7xX . я использую geom_bar согласно инструкции, и группировка данных у меня происходит нормально...
Вы предлагаете всем стать экстрасенсами и угадывать что именно не работает?
источник

A

Alexander (AlexR) in R language and Statistical data analysis
А можете прислать исходные данные?
источник

n

novicer in R language and Statistical data analysis
мне очень неловко, но кажется, я уже разобрался. основная проблема была в том, что на графике были видны только описания категориальных данных и не было видно самого графика и непосредственно чисел. я решил эту проблему указав в chunk параметры fig.width и fig.height
источник

n

novicer in R language and Statistical data analysis
`` {r, fig.width=12, fig.height = 8, echo = FALSE}
источник

PU

Philipp Upravitelev in R language and Statistical data analysis
если честно, не понимаю, как можно работать в чанках, если это не рмд в финале @@
неудобно же...
источник

ЕТ

Евгений Томилов in R language and Statistical data analysis
Philipp Upravitelev
если честно, не понимаю, как можно работать в чанках, если это не рмд в финале @@
неудобно же...
Можете пояснить, что за финал? 😅

Например, я пишу почти исключительно в них, иногда только репл юзаю.
источник

PU

Philipp Upravitelev in R language and Statistical data analysis
я имею ввиду, если это не хтмл-отчет или не страница на блогдаун
источник

n

novicer in R language and Statistical data analysis
ещё вопрос: как можно написать группировку так, чтобы агрегирующей функцией было вычитание верхнего и нижнего квантилей?
` by_maximum_dif <- family %>%
 group_by(Region) %>%
 summarise_at(vars(Total.Household.Income), funs(function(x) quantile(x)['75%'] - quantile(x)['25%']) )  %>%
 head(20) %>% ungroup() `
типа такого, но правильно...
источник

n

novicer in R language and Statistical data analysis
и ещё, как здесь правильно писать теги? я пробовал обрамлять в символ тильды, пробовал писать код после двойной тильды - не работает...
источник

ЕТ

Евгений Томилов in R language and Statistical data analysis
Philipp Upravitelev
я имею ввиду, если это не хтмл-отчет или не страница на блогдаун
А, ну, это как жупитер почти. По-моему, очень удобно.
источник

n

novicer in R language and Statistical data analysis
разобрался. нужно было просто использовать обращение к самой ячейке, а не анонимные функции - туплю...
источник

Ю

Юрий 🐙💻🤖📊📈🚬 in R language and Statistical data analysis
novicer
и ещё, как здесь правильно писать теги? я пробовал обрамлять в символ тильды, пробовал писать код после двойной тильды - не работает...
2ой раз повторяю: читаем правила чата
источник