Size: a a a

2021 May 10

VS

Vladislav 👻 Shishkov... in Data Engineers
Вот прям в лоб пишем даг, пушим в репу, оно магией прилетает на airflow, где есть авторизация с вебкой и тыканье кнопочек
источник

A

Alex in Data Engineers
а можно подробней про магию?
источник

A

Alex in Data Engineers
пока везде я только вижу “подкладываем файлик дага” и “airflow периодически парсит папку для синхронизации”
источник

VS

Vladislav 👻 Shishkov... in Data Engineers
ci/cd - простая магия
источник

SO

Simon Osipov in Data Engineers
Ну выбирать вам, но я бы начал думать со следующего пункта:

Airflow не то, чтобы стандарт de facto по запускаторству по расписанию, но крайне сильно распространенный софт.
Просто Python код для DAG, который может освоить любой R специалист.
Даже если нет, можно написать свой шаблонизатор, который будет делать DAG из параметров, CI/CD поставляется это все.

Почти любой другой инструмент для окестрации (кроме крона) существенно менее популярен и его кто-то должен будет поддерживать, а в случае собственной полноценной разработки еще и допиливать (существенно больше, чем шаблонизатор)
Поиск людей + время на создание >> коробочного решения Airflow
источник

SO

Simon Osipov in Data Engineers
Простой пример: airflow запущен на VM, Пайплайн ходит по sshпо коммиту в мастер на машину, заходит в папку с дагами и делает git pull
источник

SO

Simon Osipov in Data Engineers
Side car контейнер и git sync вариант для k8s
источник

A

Alex in Data Engineers
не прокатит, я выше указал количество пользователей

пару десятков комманд
источник

VS

Vladislav 👻 Shishkov... in Data Engineers
А как это мешает?
источник

A

Alex in Data Engineers
в итоге если все начнут мержить в репу с дагами, то быстро начнётся там треш и содомия
источник

SO

Simon Osipov in Data Engineers
Почему?
Кто мешает в команде поставить аппрувера на мердж кода DAG в прод?
источник

VS

Vladislav 👻 Shishkov... in Data Engineers
Вы вообще в курсе, что умеет airflow?
источник

SO

Simon Osipov in Data Engineers
Подождите, но в монолиты же мерджат десятки команд...
источник

A

Alex in Data Engineers
базово работал, но там было именно “подложили/git pull” на папке с дагами, смотрится это не очень если честно
источник

A

Alex in Data Engineers
есть опыт работы когда изменения в бд/ещё куда-то через gitops организованы, постоянно было проблемой через сколько это запустится

в моём случае часть задач под запуск once вот прямо сейчас
следовательно ожидать пока тебя замержут это потеря времени, я просто тестирую свою ветку на выполнение
источник

VS

Vladislav 👻 Shishkov... in Data Engineers
Какие то сферические процессные проблемы
источник

SO

Simon Osipov in Data Engineers
Возникает вопрос: зачем вам сервис, чья задача “запуск по расписанию”, для запуска задач с @once ?
источник

A

Alex in Data Engineers
сервис является точкой входа как для скедулинга, так и для одноразовых выполнений (что является вырожденным случаем заскедулить на now)
источник

AZ

Anton Zadorozhniy in Data Engineers
Argo точно, у них и CI/CD есть очень удобный
источник

A

Alex in Data Engineers
спасибо, покопаю глубже
источник