Size: a a a

2021 September 30

ПФ

Паша Финкельштейн... in Moscow Spark
из правой схемы вычитам левуют и даем нужные движения
источник

ПФ

Паша Финкельштейн... in Moscow Spark
ну значит то же самое рекурсивно
источник

ИК

Иван Калининский... in Moscow Spark
https://stackoverflow.com/questions/58917626/add-comments-to-hive-tables-using-pyspark

Посмотри первый ответ, там немного допилить, добавить каст ну и сделать коллекцию, а не одну колонку
источник

SI

Sergey Ivanychev in Moscow Spark
я понимаю, что это можно написать самому, но как-то не хочется
источник

SI

Sergey Ivanychev in Moscow Spark
там довольно много корнеркейсов, типа «слева поля нет, а справа оно nullable»
источник

ИК

Иван Калининский... in Moscow Spark
Естественно, всё добавленное появится только после сохранения
источник

SI

Sergey Ivanychev in Moscow Spark
нужно очень хорошо протестировать этот код
источник

Н

Никита in Moscow Spark
да я думаю тут реально проще циклом пройтись
def apply_schema(df, schema):
   columns = map(lambda x: df[x["name"]].cast(x["type"]).alias(x["name"], metadata=x["metadata"]), schema["fields"])
   return df.select(*list(columns))
источник

ИК

Иван Калининский... in Moscow Spark
Неплохо выглядит, можно в cookbook добавлять))
источник

SI

Sergey Ivanychev in Moscow Spark
Это не работает если разница схем во внутренних полях
источник

SI

Sergey Ivanychev in Moscow Spark
cannot cast struct<name:string,value:long> to struct<name:string> например, и так далее
источник

Н

Никита in Moscow Spark
ну там наверное можно подшаманить как-нибудь)
источник

Н

Никита in Moscow Spark
осталось понять где эти схемы держать в airflow.Variables или на hdfs или в сервисе
источник

SI

Sergey Ivanychev in Moscow Spark
ну вот отпишись, как только подшаманишь)
источник

VV

Vladislav Verba in Moscow Spark
Всем привет! А кто-нибудь что это за <unknown>:0 такой?

У меня рандомно на этих тасках процесс зависает наглухо, перестает что-либо делать или писать в логи и просто висит пока не убьешь
источник

ИК

Иван Калининский... in Moscow Spark
выглядит как что-то сгенерённое в рантайме
источник

ИК

Иван Калининский... in Moscow Spark
ну, или новый смайлик обкатывают в UI )))   >:0
источник

VV

Vladislav Verba in Moscow Spark
источник

VV

Vladislav Verba in Moscow Spark
Если что, это попытка залить  датафрейм на hdfs в формате DeltaLake с помощью pyspark + stand-alone кластера.
источник

D

Dmitry in Moscow Spark
а что за версия delta.io ? у нас на 0.6 + java такого не замечал
источник