Ребятки, объясни пожалуйста
посмотрел вакансии на Data Science и data analyst, поспрашивал у знакомых из epam и прочих организаций.
Большинство предпочитает python, а не R. с чем это может быть связано? ведь, насколько я знаю по прочтению английский статей на эту тему, в R куда больше статистических пакетов
data science это, нередко, дата инжениринг и прочие вещи рядом. а там работают люди больше с программистским образованием, чем со статистическим, что обеспечивает инструментарий. это во-первых.
во-вторых, питон, как считается, легче и интуитивнее, и у него больше экосистема. и нередко программисты-разработчики переквалифицируются в датасатанистов, и для них очевидно проще работать с тем же языком, что и ранее.
в-третьих, работает эффект массы - когда вся команда пишет на питоне, вряд ли возьмут R-щика. и в результате замкнутый круг - R бессмысленнее учить, потому что сложнее устроиться. а меньше пишущих на R - меньше вопросов, на чем делать разработку и кого нанимать
в-четвертых, поддерживать решения на R сложнее, так как людей меньше, риcков больше, соответственно.
в-пятых, в России очень мощное питонячье лобби в DS из-за яндекса да, в целом ODS
хотя лично на мой взгляд, на уровне именно датасатанизма различий не так много. тот же процессинг данных, те же модельки. ну, может, в питоне лучше с пайплайнами, и то не факт, и с деплоем моделей. плюс там больше нейросеток, а мир сейчас в ту сторону движется.
плюс, ну честно, датасаенс необязательно хардкор с точки зрения статистики. академические исследования более требовательны в этом смысле, и там R достаточно много