Size: a a a

2019 October 04

C

Combot in Data Engineers
Anujith.A.G you're looking for has been banned! Reason: CAS ban.
источник

N

Nika in Data Engineers
А можно, чтоб при деплое точно такого же джарника для спарка старый останавливался, уступая место новому ?
источник

λ

λoλdog in Data Engineers
Так он ж точно такой же, зачем его деплоить?
источник

M

Mi in Data Engineers
λoλdog
Так он ж точно такой же, зачем его деплоить?
полагаю тут речь про имя
источник

λ

λoλdog in Data Engineers
Mi
полагаю тут речь про имя
Да ты что
источник

λ

λoλdog in Data Engineers
источник

C

Combot in Data Engineers
우미 Jain has been banned! Reason: CAS ban.
источник

N

Nika in Data Engineers
λoλdog
Так он ж точно такой же, зачем его деплоить?
Ну по аналогии после переборки с изменениями подменить
источник

λ

λoλdog in Data Engineers
Тогда он не точно такой же
источник

M

Mi in Data Engineers
λoλdog
Тогда он не точно такой же
Очень полезное замечание
источник

K

KrivdaTheTriewe in Data Engineers
https://medium.com/liveramp-engineering/joining-petabytes-of-data-per-day-how-liveramp-powers-its-matching-product-fe7c0f440824  ребята на MR все еще фигарят как деды завещали
источник

OI

Oleg Ilinsky in Data Engineers
Привет!
Вопрос)
Есть какая-нибудь тула удобная для запуска и мониторинга стримов спарковских? (вызывать откуда-нибудь консольные spark-submit'ы и смотреть на них в ярне как-то не очень удобно, имхо)
источник

K

KrivdaTheTriewe in Data Engineers
Oleg Ilinsky
Привет!
Вопрос)
Есть какая-нибудь тула удобная для запуска и мониторинга стримов спарковских? (вызывать откуда-нибудь консольные spark-submit'ы и смотреть на них в ярне как-то не очень удобно, имхо)
статсд
источник

K

KrivdaTheTriewe in Data Engineers
и графана
источник

OI

Oleg Ilinsky in Data Engineers
так это же просто мониторинг
а запускать как?)
источник

S

Stanislav in Data Engineers
Oleg Ilinsky
Привет!
Вопрос)
Есть какая-нибудь тула удобная для запуска и мониторинга стримов спарковских? (вызывать откуда-нибудь консольные spark-submit'ы и смотреть на них в ярне как-то не очень удобно, имхо)
а зачем вам постоянно запускать стримы?
источник

OI

Oleg Ilinsky in Data Engineers
ну не постоянно
даже хотя бы разово. Мне нужно 20+ штук. Не запускать же их через spark-submit из консоли через какой-нибудь tmux или nohup)
источник

OI

Oleg Ilinsky in Data Engineers
к тому же, если вдруг упало, то было бы логично попробовать рестартануть разок-другой автоматически
+ получать письмо на почту/в слак или телеграм в случае окончательного падения
источник

W

Wild east in Data Engineers
https://github.com/apache/spark/blob/master/conf/metrics.properties.template настраиваем куда слать метрики
источник

В

Вадим in Data Engineers
Airflow?
источник