Size: a a a

2021 August 30

t

tenKe in Moscow Spark
ну если нормально сделать лень, то можно через to_json from_json
источник

SI

Sergey Ivanychev in Moscow Spark
Хм, кстати варик
источник

t

tenKe in Moscow Spark
хотя конечно в этом варианте есть риск прострелить себе оба колена из-за проблем жсон парсера спарка
источник

ЕГ

Евгений Глотов... in Moscow Spark
Мне кажется через хайв не прокатит, так как это структы
источник

ИК

Иван Калининский... in Moscow Spark
Во-первых, я не очень понимаю, как можно переопределить схему, не переопределяя данные.
Во-вторых, чем же не устраивает .withColumn, .withColumnRenamed, .drop?
источник

ЕГ

Евгений Глотов... in Moscow Spark
Колено в любом случае будет прострелено, так что лучше пиши код, чтоб быстрее залечить)
источник

ИК

Иван Калининский... in Moscow Spark
даже не как, а зачем переопределять схему в отрыве от данных?
источник

t

tenKe in Moscow Spark
неправда :3 Предложенный мной вариант работает на отличненько 🙂
источник

ЕГ

Евгений Глотов... in Moscow Spark
Ну да, это можно сказать етл
источник

t

tenKe in Moscow Spark
и главное в нем можно учесть все корнер кейсы
источник

ЕГ

Евгений Глотов... in Moscow Spark
Меня вот бесит что from_json требует схему
источник

t

tenKe in Moscow Spark
я не про этот вариант)
источник

t

tenKe in Moscow Spark
to_json from_json такое себе
источник

SI

Sergey Ivanychev in Moscow Spark
да банально коллега добавляет в таблицу поле, я хочу чтобы версионированная версия это таблицы автоматом подхватывала изменение схемы. Или хотябы полуавтоматом
источник

SI

Sergey Ivanychev in Moscow Spark
Но без ручных ковыряний в схеме каждой таблицы
источник

ЕГ

Евгений Глотов... in Moscow Spark
Коллегу в тёмном переулке подкарауль и жизни научи
источник

ЕГ

Евгений Глотов... in Moscow Spark
Нехорошо править схему таблицы без переделки данных в любом случае
источник

ЕГ

Евгений Глотов... in Moscow Spark
Даже если ты инт на лонг поменял
источник

ЕГ

Евгений Глотов... in Moscow Spark
Или он полностью переделывает таблицу, а ты просто не хочешь переписывать в случае его изменений свой етл?
источник

SI

Sergey Ivanychev in Moscow Spark
руками поменять схему я могу, но если коллега добавляет поле в таблицу — его заставлять еще и дописывать код версионированной? Это такое себе
источник