Вообще я ни разу не против спарка, но у всего есть своя ниша, в большинстве клиентских архитектур Спарк это инструмент для пайплайнов и местами ДС, а в конце данные попадают в redshift, big query или vertica, и для своих задач они конечно лучше подходят
Я пока от коллег ещё не слышал позитивных отзывов о ДС на спарке, и сатанистов, которые на нем делают МЛ, ещё не встречал. Но должен отметить, что и круг знакомых у меня небольшой. У вас есть позитивный опыт, или есть какие-то плюсы для МЛ на спарке?