у нас пока тоже в докер-образ для airflow-worker инсталлированы все клиентские либы хадупа в ближайшее время хочу перевести его на тонких клиентов - httpfs и beeline с kerberos
Celery. Есть шедулер, который по сути воркер celery, он ставит в очередь (через redis или rabbitmq) задачи, которые потом запускаются на других воркерах