Size: a a a

2021 August 08

SI

Sergey Ivanychev in Moscow Spark
Наверное, проблема тут может быть в том, что должна быть корректная эволюция схемы. Руками json править приведёт рано или поздно к взрыву на месте чтения сырых данных
источник

SI

Sergey Ivanychev in Moscow Spark
Потому что кто-то захочет int на double поменять или поле удалить
источник

SI

Sergey Ivanychev in Moscow Spark
avro и protobuf тут, имхо, отличные решения, только к паркету и парсингу сырых данных их сложно прикрутить
источник

SI

Sergey Ivanychev in Moscow Spark
У нас схему публикует в аналитику источник, мы ее тестируем на прямую и обратную совместимость с той, что в проде . Если она ок, то записываем ее и используем, если не ок, то хранилище метаданных алярмами орет, что источник поменял схему несовместимо
источник

G

Gev in Moscow Spark
Могут. Они владельцы данных а мы один из потребителей
источник

SI

Sergey Ivanychev in Moscow Spark
avro registry по идёте кайфовое решение в мире, где сырые данные приходят в авро
источник

G

Gev in Moscow Spark
Именно
Поэтому нужна история эволюции схему с тем чтобы поддерживать возможность чтения старых даннвх
источник

G

Gev in Moscow Spark
Ну вот да но тут не авро
источник

SI

Sergey Ivanychev in Moscow Spark
Вот на описанную мной схему это отлично ложится
источник

SI

Sergey Ivanychev in Moscow Spark
Можно взять документную бд, и класть в неё схемы, которые прямо конвертируются в спарковый StructType
источник

SI

Sergey Ivanychev in Moscow Spark
Но да, это отдельный сервис будет
источник

G

Gev in Moscow Spark
Куда публикует и в какие срок и главно - есть разрыв по срокам между изменением данпых и исправлением кода
источник

SI

Sergey Ivanychev in Moscow Spark
Это не проблема, если эволюция схемы прямо и обратно совместимая
источник

SI

Sergey Ivanychev in Moscow Spark
В таком случае ты с самой новой схемой сможешь перечитать старые данные
источник

G

Gev in Moscow Spark
Именно так. Я в уелом так и проектировал ситуацию. Впрос был много проще - наличие уже готовой реализации
источник

SI

Sergey Ivanychev in Moscow Spark
Если его узнаёшь, буду рад если поделишься)
источник

G

Gev in Moscow Spark
Таки нет такого :)
А на сомом деле - идея на поверхности и многим была бы нужна.
Странно
источник
2021 August 09

NN

No Name in Moscow Spark
@pomadchin тут какой-то стремный физрук
источник

PK

Pavel Klemenkov in Moscow Spark
Физруки они такие, ушел в бан
источник

NN

No Name in Moscow Spark
Данке
источник