Size: a a a

2019 June 17

GG

George Gaál in Data Engineers
и версия у тебя будет... бадамс... 1.10.2
источник

DZ

Dmitry Zuev in Data Engineers
Плюс у них даги в gs лежат, и синкаются. Не думаю что это большая проблема. Но
источник

GG

George Gaál in Data Engineers
Dmitry Zuev
Всякие морды прокидывать еще
ингресс, йоу
источник

GG

George Gaál in Data Engineers
Dmitry Zuev
Плюс у них даги в gs лежат, и синкаются. Не думаю что это большая проблема. Но
правильно их печь в докер образа
источник

DZ

Dmitry Zuev in Data Engineers
George Gaál
правильно их печь в докер образа
Чоо?
источник

DZ

Dmitry Zuev in Data Engineers
George Gaál
ингресс, йоу
Через впн
источник

DZ

Dmitry Zuev in Data Engineers
George Gaál
и версия у тебя будет... бадамс... 1.10.2
А какая сейчас в моде?
источник

GG

George Gaál in Data Engineers
ну, есть два принципиально разных подхода
1. у тебя все даги лежат в отдельном вольюме, который монтируется везде - к воркерам, шедюлеру, вебке
2. все засовываешь ВНУТРЬ докера, ничего снаружи не торчит. Когда нужно - перестартуешь все компоненты с новой версии образа - это самый верный для докера вариант
источник

GG

George Gaál in Data Engineers
Dmitry Zuev
Через впн
ну, тогда можно и ингресс в принципе не настраивать
источник

DZ

Dmitry Zuev in Data Engineers
Кароч, в нашей тиме из четверых калек, это реально снимает головняк, и можно дальше прозибать понаписывая очередной етл
источник

SB

Sergey Bilenko in Data Engineers
Dmitry Zuev
Кароч, в нашей тиме из четверых калек, это реально снимает головняк, и можно дальше прозибать понаписывая очередной етл
Я так понимаю, вся обработка крутится на серверах Google (в облаке) и они за это денег просят? К сожалению, не все данные можно отдавать на чужие сервера ):
источник

DZ

Dmitry Zuev in Data Engineers
канеше, compsoser -> gke -> gce
источник

DZ

Dmitry Zuev in Data Engineers
ну там вроде можно на remote k8s сабмитить
источник

Н

Никита in Data Engineers
Здравствуйте, коллеги! Никто из вас не выгружал логи приложений YARN из Hadoop в logstash? Почему-то на сайте эластика нет соответствующего плагина, позволяющего вычитывать из hdfs. Никто не занимался чем-то подобным? Есть какие-то best practices?
источник

SB

Sergey Bilenko in Data Engineers
Нам поудобнее будет Kafka + Spark. И данные не нужно никому отдавать.
источник

РА

Рамиль Ахмадеев in Data Engineers
Никита
Здравствуйте, коллеги! Никто из вас не выгружал логи приложений YARN из Hadoop в logstash? Почему-то на сайте эластика нет соответствующего плагина, позволяющего вычитывать из hdfs. Никто не занимался чем-то подобным? Есть какие-то best practices?
логстеш может hdfs, а вообще там есть же logsearch вроде как
источник

K

KrivdaTheTriewe in Data Engineers
Dmitry Zuev
вообще все это конфигодрочерство после нормальной разработки меня дико бесит. И по этому пытаюсь найти отдушино в гугле
Сделай докероператор который делает все что тебе нужно
источник

DZ

Dmitry Zuev in Data Engineers
это тоже понятно
источник

K

KrivdaTheTriewe in Data Engineers
Пришли к тому , что вообще все запускает докероператор и внутри докер оператора все работает
источник

K

KrivdaTheTriewe in Data Engineers
Конекшон можно и пробросить
источник