Size: a a a

2022 February 03

k

kvadratura in Moscow Spark
not bad 👍
источник

ЕГ

Евгений Глотов... in Moscow Spark
Overwrite по умолчанию делает дроп всей папки и создаёт заново
источник

ЕГ

Евгений Глотов... in Moscow Spark
Возможно на саму папку нет прав
источник

k

kvadratura in Moscow Spark
осторожней с insert into. оно вроде не проверяет порядок полей, и может одно поле записать в другое, если типы совпадают
источник

ЕГ

Евгений Глотов... in Moscow Spark
И вообще 1 случай так себе, лучше сделать
write.mode("overwrite").saveAsTable("table")
источник

Н

Никита in Moscow Spark
то есть, если я сделаю mode = "append" то всё будет ок?
источник

ЕГ

Евгений Глотов... in Moscow Spark
Не надо вставлять мимо таблицы в папку
источник

ЕГ

Евгений Глотов... in Moscow Spark
Это некорректно
источник

ЕГ

Евгений Глотов... in Moscow Spark
Соответственно append так же
источник

Н

Никита in Moscow Spark
А партиции не пропадут в таком случае?
источник

ЕГ

Евгений Глотов... in Moscow Spark
Какие именно?
источник

ЕГ

Евгений Глотов... in Moscow Spark
Всё дропнется и перезапишется с нуля
источник

ЕГ

Евгений Глотов... in Moscow Spark
И появятся новые партиции все
источник

Н

Никита in Moscow Spark
Я перепроверю , но скорее всего у меня нет прав на дроп таблицы
Только чтение и запись
источник

Н

Никита in Moscow Spark
А почему это не корректно?


Я правильно понял, что нужно всегда прописывать в конце saveAsTable?
источник

PL

Pavel Lu in Moscow Spark
вопрос на засыпку - чем отличается insertInto(...) от saveAsTable(...) ? mode и там и там overwrite
источник

М

Мукола in Moscow Spark
1) df.write.partitionBy("col1", "col2").mode('overwrite').parquet('path to table data location')
try use 1) df.write.partitionBy("col1", "col2").mode('overwrite').format("parquet").saveAsTable("db.table")?
источник

М

Мукола in Moscow Spark
"overwrite" vs "append" !!!!!
источник

ЕГ

Евгений Глотов... in Moscow Spark
insertOverwriteMode=dynamic
источник

ЕГ

Евгений Глотов... in Moscow Spark
И куча проблем
источник