всім привіт, після джоіну двох csv файлі, намагаюсь відсортувати отриманий датафрейм (37 тисяч записів) за конкретним полем created, коли юзаю пандас то все відбувається дуже швидко, коли хочу заюзати spark, крутиться хвилин 20, може я щось роблю не так ?
spark
df_sorted = df.orderBy("created", ascending=True).collect()pandas =
df_sorted = df.sort_values(by=["created"])
якщо хтось знає допоможіть пліз, гарного дня)