И вообще какое-то неинженерное вознесение спарка, это популярный тул для написания пакетной логики над данными в объектном сторадже и (сильно хуже) в стриминге, но у него же море проблем: нет своего каталога и беда со статистикой от этого (и тормоза на ad-hoc analytics), отношения на Вы с ресурсными менеджерами (отсюда проблемы с памятью и преемпшеном, в том числе беда с интеграционным задачами) и не говоря про метаданные и модель безопасности самого движка (column/row level security?); нормальный инструмент чтобы вытеснить Pig/Hive для пакетных задач, но не более того..