Size: a a a

2021 May 28

В

Вячеслав in Data Engineers
Байт-код так-то тоже "ассемблерный", только универсальнее. :)
источник

AZ

Anton Zadorozhniy in Data Engineers
Like
источник

AZ

Anton Zadorozhniy in Data Engineers
R не лишним будет, прекрасный язык, проигрывает в популярности питону в деле ДС/ДЕ не по техническим причинам
источник

GP

Grigory Pomadchin in Data Engineers
По техническим тоже
источник

ME

Max Efremov in Data Engineers
а он разве не более научный, как джулия, например или язык маткада?
источник

PA

Panchenko Andrey in Data Engineers
такой же как и питон стал в последнее время) практически все можно делать, очень большое комьюнити
источник

PA

Panchenko Andrey in Data Engineers
а вот некоторые штуки удобнее и лаконичнее как мне кажется
источник

PA

Panchenko Andrey in Data Engineers
осбенно пайпы в dplyr
источник

AZ

Anton Zadorozhniy in Data Engineers
Это язык для работы с данными, причём изначально функциональный (внутри много от Scheme), что позволяет делать крутые вещи вроде dplyr или shiny
источник

PA

Panchenko Andrey in Data Engineers
это мои любимые либы )))
источник

AZ

Anton Zadorozhniy in Data Engineers
Сильная инженерная культура (сравните реализацию RDS и pickle), хорошее сообщество
источник

PF

Pavel Filatov in Data Engineers
R топ👍
источник

D

Dmitry in Data Engineers
а он по кластеру нагрузку размазывать разве  умеет ?
источник

AT

Al T in Data Engineers
а я видел у меня и терабайта данных не было, но были дашбоарды по 15 виджетов и кастомеров штук 40. выходило по $5k в день )) но недолго
источник

AZ

Anton Zadorozhniy in Data Engineers
Это язык, он сам по себе ничего не размазывает; на нем есть DSLи для разных размазывателей, есть для спарка, есть для наших кластеров
источник

D

Dmitry in Data Engineers
для спарка же  прокладка сильно уступающая scala/java. получается язык заточен на данные но в реальных условиях уступает тем кто не заточен
источник

AZ

Anton Zadorozhniy in Data Engineers
Sparklyr многим хватает (если вы пишете на датафреймах pyspark то это тоже самое), локальные штуки сильно лучше панд
источник

D

Dmitry in Data Engineers
ну да, те же перфоменс проблемы что у pyspark, потому в боевых условиях переписывают. разве не так ?
источник

AZ

Anton Zadorozhniy in Data Engineers
Я не видел «переписывания», те мои клиенты у которых был Спарк они узкие пайплайны писали изначально на скале, а sparklyr уже у сатанистов чтобы поднять что-то из витрин
источник

AZ

Anton Zadorozhniy in Data Engineers
Ну и потом далеко не у всех spark, а преимущество dplyr что там язык одинаковый что с локальными данными, что с SQL движками
источник