Size: a a a

2021 July 30

GP

Grigory Pomadchin in Moscow Spark
источник

ПФ

Паша Финкельштейн... in Moscow Spark
Ну это же просто .read.orc().withColumn(mycol.as(othertype)).dropColumn().write.orc()
источник

AK

Andrew Konstantinov in Moscow Spark
а как мне разом во всех партициях это сделать?
источник

AK

Andrew Konstantinov in Moscow Spark
только не циклом
источник

ПФ

Паша Финкельштейн... in Moscow Spark
А у вас там точно только Спарк?
источник

AK

Andrew Konstantinov in Moscow Spark
да
источник

ПФ

Паша Финкельштейн... in Moscow Spark
Или может с хайвом каким?
источник

AK

Andrew Konstantinov in Moscow Spark
без хайва
источник

ПФ

Паша Финкельштейн... in Moscow Spark
.mapPartitions?
источник

GP

Grigory Pomadchin in Moscow Spark
ну я не понимаю на самом деле вопроса
источник

ПФ

Паша Финкельштейн... in Moscow Spark
Я тоже
источник

GP

Grigory Pomadchin in Moscow Spark
наверное тут какаято история
источник

ПФ

Паша Финкельштейн... in Moscow Spark
Что такое Спарк партишны?
источник

ПФ

Паша Финкельштейн... in Moscow Spark
Обычно это просто условно внутренняя сущность, которую удобно себе представить как кусок датафрейма
источник

GP

Grigory Pomadchin in Moscow Spark
но если через спарк; то спарк грузанет все париишоны орка в память; схему поправишь; он запишет в новую папку новые данные

все будет новое и поправленное
источник

GP

Grigory Pomadchin in Moscow Spark
не знаю ответит ли это на твой вопрос
источник

AK

Andrew Konstantinov in Moscow Spark
данные разбиты понедельно в соответствующие партиции.в одной партиции колонка user ==int ,в другой ==float
источник

ПФ

Паша Финкельштейн... in Moscow Spark
И мы о ней можем не думать когда нам надо провести преобразование над всеми данными
источник

GP

Grigory Pomadchin in Moscow Spark
хы
источник

ПФ

Паша Финкельштейн... in Moscow Spark
А разбивали как?
источник