Вынеси отдельно вычисление максимума, получи его значение на локальной машине в переменную с помощью collect() и добавь в большой запрос с помощью lit(value)
Ещё можно извратиться и написать оконкой - withColumn("max", max("col1").over(Window.orderBy("col1")) Но такая оконка будет в 1 поток выполняться, не параллельно, так как нет партишенбай
В смысле не очевидно, что после такого withColumn датафрейм с одной партицией получится, так ещё и сортировка лишняя будет. Вредный совет какой-то получается)
Вопрос: есть датафрейм (который parquet-таблица) и новая схема — я хочу поменять схему датафрейма, мб добив null’ами колонки, которые добавились. Это как-то можно вменяемо сделать (пусть даже с полной перезаписью)?