Про разрастание: ну при нормальной структуре это не будет сильно отличаться от отдельного репозитория со спарком. Про бэкап: ну я надеюсь что у вас и так всё в Гите :)
Помимо этого, в случае долговременного падения аирфлоу, банально запустить код будет проблематично. В целом складывается ощущение, что кроме того, что это решение as is
Если ли там какой-то способ обойти ограничение по памяти, по типу разбить на маленькие куски и соединить, если не вмещается на ноду? Не получается перевести в пандас С самим пайспарком не работал