Size: a a a

2019 April 12

SO

Simon Osipov in Moscow Spark
.option('truncate', 'True') или как?

был только .mode('overwrite')..
источник

АЖ

Андрей Жуков... in Moscow Spark
write.option("truncate", "true")
источник

SO

Simon Osipov in Moscow Spark
при том, что режим останется overwrite?
источник

АЖ

Андрей Жуков... in Moscow Spark
Угу
источник

SO

Simon Osipov in Moscow Spark
без truncate он делает drop по умолчанию, верно?
источник

АЖ

Андрей Жуков... in Moscow Spark
Simon Osipov
без truncate он делает drop по умолчанию, верно?
Да
источник

SO

Simon Osipov in Moscow Spark
Ок, спасибо.
источник

АЖ

Андрей Жуков... in Moscow Spark
источник

PK

Pavel Klemenkov in Moscow Spark
А, вопрос был drop VS truncate? Да, пересоздает схему, не понял вопрос
источник
2019 April 14

t

tenKe in Moscow Spark
источник

PK

Pavel Klemenkov in Moscow Spark
@tenKe спасибо тебя тоже админом сделал
источник

t

tenKe in Moscow Spark
Все, теперь про спарк говорим либо хорошо, либо никак!
источник

t

tenKe in Moscow Spark
источник

GP

Grigory Pomadchin in Moscow Spark
tenKe
Все, теперь про спарк говорим либо хорошо, либо никак!
бань всех 👍
источник
2019 April 15

AA

Anton Alekseev in Moscow Spark
Подскажите что почитать чтобы понять почему такие результаты для одного csv получаются и для toPandas на csv из 100 частей, что-то непонял из доков.
источник

AA

Anton Alekseev in Moscow Spark
источник

AA

Anton Alekseev in Moscow Spark
Читаю и csv и паркет через spark.read
источник

AA

Anton Alekseev in Moscow Spark
6 экзекьюторов
источник

AA

Anton Alekseev in Moscow Spark
все файлы gzip-ом пожаты при создании
источник

AA

Anton Alekseev in Moscow Spark
файл один и тот же просто дроблёный на запчасти
источник