SI
spark.table(…).limit(1000000).collect() генерирует этот планSize: a a a
SI
spark.table(…).limit(1000000).collect() генерирует этот планSI
spark.table(…).limit(1000000).toPandas()` генерирует такоеSI
SI
SI
toPandas() так криво работает? Как вы собираете в пайспарке большие датасеты, скажем, для обучения?DZ
SI
DZ
SI
SI
DZ
SI
SI
pd.read_parquet("s3://...") прям работает?GP
DZ
GP
GP