Size: a a a

2021 May 18

ПФ

Паша Финкельштейн... in Data Engineers
1. Ставим эирфлоу
источник

UD

Uncel Duk in Data Engineers
Ну как минимум виндовый шедулер
источник

UD

Uncel Duk in Data Engineers
Дальше насколько хватит полета фантазии
источник

ME

Max Efremov in Data Engineers
даги на виндовом планировщике? А так можно?
источник

ME

Max Efremov in Data Engineers
Хотя... Если запущенная программа будет посылать ивент в журнал винды, то можно настроить триггер другой джобы на этот ивент)
источник

N

Nikita Blagodarnyy in Data Engineers
А у вас информатика на виндовз сервере не стоит?
источник

T

T in Data Engineers
Привет, я тут с глупым вопросом про delta lake, извините. Я что то не понял что происходит с изначальным дата фаилом в нем когда приходит usert. Будет ли генерироваться новый фаил содержащий изменения ? Если да то что происходит со старой версией? Или он просто все кладет в лог и потом при чтении (или на этапе компатинга) накладывает его на оригинальный фаил?
источник

N

Nikita Blagodarnyy in Data Engineers
Ты что ли бенчмаркаешь новомодные датаформаты с апдейтами?
источник

T

T in Data Engineers
А все нашел у бриксов в блоге как оно работает
источник

T

T in Data Engineers
Ну почти мне надо, зажечь народ смигрироваться а не городить велосипеды. А для этого надо сначала подготовить почту простым интродакшенари. А бечмаркинг и внедрение я делегирую
источник

T

T in Data Engineers
Я же в корпорации работаю, там шаг ноль это внедрить идею, как можно большему числу людей и показать что вон мир как далеко ушел.
источник
2021 May 19

N

Nikita Blagodarnyy in Data Engineers
До худей не дошёл?
источник

AB

Anatoly B in Data Engineers
привет! попросили про spark sql лекцию+семинар провести, а у меня кажется материала не набирается - простые квери, агрегаты, джойны, UDF, паркет, что бы вы добавили в такое?)
идея есть какой-то сложный агрегат накрутить, визуализацию результата может быть, джойны похитрее и побенчмаркать в сравнении с RDD
источник

ЕГ

Евгений Глотов... in Data Engineers
Можно поставить windows subsystem for linux, а дальше по отработанной схеме)
источник

ЕГ

Евгений Глотов... in Data Engineers
Взаимодействие с hive metastore, jdbc sources
источник

AB

Anatoly B in Data Engineers
а что-то более завёрнутое на сам spark sql
может агрегации какие интересные?

jdbc может быть
источник

ЕГ

Евгений Глотов... in Data Engineers
Множественные оконные функции с вынесением общего окна, например
источник

AB

Anatoly B in Data Engineers
звучит стильно, а есть пример, я может не до конца понимаю, что ты имеешь ввиду
источник

ЕГ

Евгений Глотов... in Data Engineers
источник

N

Nikita Blagodarnyy in Data Engineers
Семи джойн, анти джойн, натурал джойн. Замена ина на экзист, чтобы избавиться от бродкаст нестед лупс. Примеры бродкастинга и хинтования.
источник