Size: a a a

R language and Statistical data analysis

2020 March 26

А[

Александр [capsula] in R language and Statistical data analysis
Anton Pysanka
смотрю в интернете – для подписей используют geom_text
library(ggplot2)

pie_chart_df_ex <- data.frame(Category = c("Baseball", "Basketball", "Football", "Hockey"), "freq" = c(510, 66, 49, 21))

ggplot(pie_chart_df_ex, aes (x="", y = freq, fill = factor(Category))) +
 geom_bar(width = 1, stat = "identity") +
 geom_text(aes(label = paste(round(freq / sum(freq) * 100, 1), "%")),
           position = position_stack(vjust = 0.5)) +
 theme_classic() +
 theme(plot.title = element_text(hjust=0.5),
       axis.line = element_blank(),
       axis.text = element_blank(),
       axis.ticks = element_blank()) +
 labs(fill = "Category",
      x = NULL,
      y = NULL,
      title = "Pie Chart of Blue Chip Makeup") +
 coord_polar("y")
источник

Y

Yaroslav in R language and Statistical data analysis
уже более менее цифры расположены, благодарю
источник
2020 March 27

AS

Alexander Semenov in R language and Statistical data analysis
Всё таки странный язык этот наш R. Как я должен по этой ошибке догадаться, что проблема заключалась в том, что датафрейм был tbl_df, а не классический data.frame.
источник

AS

Alexander Semenov in R language and Statistical data analysis
А ведь я было побежал смотреть, что не так с этими айдишниками...
источник

IT

Inip Tyig in R language and Statistical data analysis
ну дело тут не в языке, а в библиотеке, очевидно
источник

a

aGricolaMZ in R language and Statistical data analysis
проблема, мне не кажется не в этом
источник

IT

Inip Tyig in R language and Statistical data analysis
классическая протекшая абстракция, вот и не было ничего понятно
источник

EK

Eugene Kasatkin in R language and Statistical data analysis
Ребятки, объясни пожалуйста
посмотрел вакансии на Data Science и data analyst, поспрашивал у знакомых из epam и прочих организаций.
Большинство предпочитает python, а не R. с чем это может быть связано? ведь, насколько я знаю по прочтению английский статей на эту тему, в R куда больше статистических пакетов
источник

AS

Alexander Semenov in R language and Statistical data analysis
Ого, какой наброс.
источник

AK

Alexey Khavylo in R language and Statistical data analysis
Пятница же )))
источник

PD

Pavel Demin in R language and Statistical data analysis
Eugene Kasatkin
Ребятки, объясни пожалуйста
посмотрел вакансии на Data Science и data analyst, поспрашивал у знакомых из epam и прочих организаций.
Большинство предпочитает python, а не R. с чем это может быть связано? ведь, насколько я знаю по прочтению английский статей на эту тему, в R куда больше статистических пакетов
Я не главный эксперт в это чате :))
но лично у меня есть кейс: друг работает DS, все делает на питоне. В работе ему приходилось сталкиваться с R, в том числе писать шайни. Он пожаловался на то, что R «как-то совсем не похож на другие языки» (видимо ООП), поэтому, мол, на нем неудобно писать. Отсюда делаю два заключения, почему R менее популярен - на конкретном примере:
1) у питона своего рода экосистема, он сравнительно легче интегрируется с другими языками
2) в DS многие приходит с образованием и опытом CS, где они точно проходили питон, и вряд ли R
источник

EK

Eugene Kasatkin in R language and Statistical data analysis
Pavel Demin
Я не главный эксперт в это чате :))
но лично у меня есть кейс: друг работает DS, все делает на питоне. В работе ему приходилось сталкиваться с R, в том числе писать шайни. Он пожаловался на то, что R «как-то совсем не похож на другие языки» (видимо ООП), поэтому, мол, на нем неудобно писать. Отсюда делаю два заключения, почему R менее популярен - на конкретном примере:
1) у питона своего рода экосистема, он сравнительно легче интегрируется с другими языками
2) в DS многие приходит с образованием и опытом CS, где они точно проходили питон, и вряд ли R
спасибо за ответ)
толькак расшиврофывается CS
источник

А[

Александр [capsula] in R language and Statistical data analysis
Eugene Kasatkin
спасибо за ответ)
толькак расшиврофывается CS
Компуктер сциенсе
источник

PD

Pavel Demin in R language and Statistical data analysis
Eugene Kasatkin
спасибо за ответ)
толькак расшиврофывается CS
Да, computer science
источник

БА

Байкулов Антон in R language and Statistical data analysis
Pavel Demin
Я не главный эксперт в это чате :))
но лично у меня есть кейс: друг работает DS, все делает на питоне. В работе ему приходилось сталкиваться с R, в том числе писать шайни. Он пожаловался на то, что R «как-то совсем не похож на другие языки» (видимо ООП), поэтому, мол, на нем неудобно писать. Отсюда делаю два заключения, почему R менее популярен - на конкретном примере:
1) у питона своего рода экосистема, он сравнительно легче интегрируется с другими языками
2) в DS многие приходит с образованием и опытом CS, где они точно проходили питон, и вряд ли R
Как по мне, так R очень логичен
источник

ГД

Григорий Демин in R language and Statistical data analysis
Байкулов Антон
Как по мне, так R очень логичен
Ну это вопрос не в логике, это синдром утёнка. Человек что-то выучил первым, потом все непохожее кажется нелогичным и неправильным
источник

БА

Байкулов Антон in R language and Statistical data analysis
источник

PU

Philipp Upravitelev in R language and Statistical data analysis
Eugene Kasatkin
Ребятки, объясни пожалуйста
посмотрел вакансии на Data Science и data analyst, поспрашивал у знакомых из epam и прочих организаций.
Большинство предпочитает python, а не R. с чем это может быть связано? ведь, насколько я знаю по прочтению английский статей на эту тему, в R куда больше статистических пакетов
data science это, нередко, дата инжениринг и прочие вещи рядом. а там работают люди больше с программистским образованием, чем со статистическим, что обеспечивает инструментарий. это во-первых.
во-вторых, питон, как считается, легче и интуитивнее, и у него больше экосистема. и нередко программисты-разработчики переквалифицируются в датасатанистов, и для них очевидно проще работать с тем же языком, что и ранее.
в-третьих, работает эффект массы - когда вся команда пишет на питоне, вряд ли возьмут R-щика. и в результате замкнутый круг - R бессмысленнее учить, потому что сложнее устроиться. а меньше пишущих на R - меньше вопросов, на чем делать разработку и кого нанимать
в-четвертых, поддерживать решения на R сложнее, так как людей меньше, риcков больше, соответственно.
в-пятых, в России очень мощное питонячье лобби в DS из-за яндекса да, в целом ODS

хотя лично на мой взгляд, на уровне именно датасатанизма различий не так много. тот же процессинг данных, те же модельки. ну, может, в питоне лучше с пайплайнами, и то не факт, и с деплоем моделей. плюс там больше нейросеток, а мир сейчас в ту сторону движется.

плюс, ну честно, датасаенс необязательно хардкор с точки зрения статистики. академические исследования более требовательны в этом смысле, и там R достаточно много
источник

ГД

Григорий Демин in R language and Statistical data analysis
Вот никогда не мог понять, откуда это взялось:

во-вторых, питон, как считается, легче и интуитивнее

Хоть исследование проводи по поиску первого упоминания
источник

AS

Alexander Semenov in R language and Statistical data analysis
Philipp Upravitelev
data science это, нередко, дата инжениринг и прочие вещи рядом. а там работают люди больше с программистским образованием, чем со статистическим, что обеспечивает инструментарий. это во-первых.
во-вторых, питон, как считается, легче и интуитивнее, и у него больше экосистема. и нередко программисты-разработчики переквалифицируются в датасатанистов, и для них очевидно проще работать с тем же языком, что и ранее.
в-третьих, работает эффект массы - когда вся команда пишет на питоне, вряд ли возьмут R-щика. и в результате замкнутый круг - R бессмысленнее учить, потому что сложнее устроиться. а меньше пишущих на R - меньше вопросов, на чем делать разработку и кого нанимать
в-четвертых, поддерживать решения на R сложнее, так как людей меньше, риcков больше, соответственно.
в-пятых, в России очень мощное питонячье лобби в DS из-за яндекса да, в целом ODS

хотя лично на мой взгляд, на уровне именно датасатанизма различий не так много. тот же процессинг данных, те же модельки. ну, может, в питоне лучше с пайплайнами, и то не факт, и с деплоем моделей. плюс там больше нейросеток, а мир сейчас в ту сторону движется.

плюс, ну честно, датасаенс необязательно хардкор с точки зрения статистики. академические исследования более требовательны в этом смысле, и там R достаточно много
Как боженька смолвил!
источник