вопрос по спарк 3.2 и адаптивному выполнению:
у нас есть утилитные методы по добавлению соли/функции для репартишена
есть тесты на это всё
(условно создали датафрейм с солью на 5-10 элементов, сделали репартишен и тд)
так как партиций задали побольше, то получали сколько-то партиций с 1 елементом внутри
и вот адаптив теперь понимает что "хм, пару мелких партиций, давай я их в 1 солью"
там где после репартишена мелких таблиц на 1000 элементов раньше было несколько партиций, то сейчас остаётся 1 партиция после выполнения