Size: a a a

2021 September 07

ПФ

Паша Финкельштейн... in Moscow Spark
Да, но пайтон оператор сделали в частности потому что не все согласны с этим подходом.
источник

ПФ

Паша Финкельштейн... in Moscow Spark
Про разрастание: ну при нормальной структуре это не будет сильно отличаться от отдельного репозитория со спарком.
Про бэкап: ну я надеюсь что у вас и так всё в Гите :)
источник

АА

Артем Анистратов... in Moscow Spark
Помимо этого, в случае долговременного падения аирфлоу, банально запустить код будет проблематично. В целом складывается ощущение, что кроме того, что это решение as is
источник

ЕГ

Евгений Глотов... in Moscow Spark
Есть противоположный подход, один даг - один таск)
источник
2021 September 08

KR

Kagermanov Ramazan in Moscow Spark
Доброе утро!
Подскажите, пожалуйста, как df можно сохранить в excel?
Есть ли встроенная функция в спарк, тк подключить библиотеки не так просто
источник

ПФ

Паша Финкельштейн... in Moscow Spark
Нет, встроенной функции нет
источник

ПФ

Паша Финкельштейн... in Moscow Spark
Без библиотек сделать можно, но крайне сложно — придётся вручную составлять XML, а потом его паковать
источник

N

Nail in Moscow Spark
CSV?
источник

АА

Артем Анистратов... in Moscow Spark
Но в екселе потом ручками нужно будет разбивать на колонки
источник

KR

Kagermanov Ramazan in Moscow Spark
Проблема с типами могут быть плюс сложности в переводе в sql
источник

KR

Kagermanov Ramazan in Moscow Spark
А не встроенная это crealytics, верно?
есть ли ещё варианты?
источник

PK

Pavel Klemenkov in Moscow Spark
На пйаспарке все просто df.toPandas().to_excel()
источник

KR

Kagermanov Ramazan in Moscow Spark
Если ли там какой-то способ обойти ограничение по памяти, по типу разбить на маленькие куски и соединить, если не вмещается на ноду?
Не получается перевести в пандас
С самим пайспарком не работал
источник

PK

Pavel Klemenkov in Moscow Spark
Если у тебя датафрейм не влезает на драйвер, то писать его в эксель выглядит очень сомнительным мероприятием.
источник

ММ

Максим Мартынов... in Moscow Spark
Нативной функции нет, придется писать самому
источник

KR

Kagermanov Ramazan in Moscow Spark
Мне надо получить таблицу на локальный компьютер и загрузить в sql
источник

ММ

Максим Мартынов... in Moscow Spark
А excel зачем?
источник

N

Nikita Blagodarnyy in Moscow Spark
и че прям xlsx файл получится?
источник

PK

Pavel Klemenkov in Moscow Spark
Да
источник

ПФ

Паша Финкельштейн... in Moscow Spark
Ну я бы на Apache POI делал конечно
источник