ИС
есть три однотипных dataframe - большой, средний и маленький. В каком порядке оптимально их заджоинить?
Size: a a a
ИС
A
A
ИС
A
ЕГ
ЕГ
ЕГ
ЕГ
ЕГ
ЕГ

ЕГ
A
ЕГ
A
ЕГ
ЕГ
ЕГ
ИС
А
(spark_partition_id()*10000000) + ROW_NUMBER() OVER(PARTITION BY spark_partition_id() ORDER BY 1 ) as rnвроде, же должно параллелиться по spark_partition_id