Size: a a a

2021 September 06

ЕГ

Евгений Глотов... in Data Engineers
Обычный де и грузит данные в обход даталейка
источник

AZ

Anton Zadorozhniy in Data Engineers
А, ну то есть он/она не промышленный код пишет, а прототип делает?
источник

РП

Роман Пашкевич... in Data Engineers
Да.
источник

ЕГ

Евгений Глотов... in Data Engineers
А потом сдает их
источник

РП

Роман Пашкевич... in Data Engineers
Как пример. Я 2й год гружу данные из SAP HANA, скриптом на Питоне+Spark. Все подсели на эту витрину, и не особо хотят переходить на промышленную от ETL)
источник

ЕГ

Евгений Глотов... in Data Engineers
И как это связано с dq?
источник

ЕГ

Евгений Глотов... in Data Engineers
Вот если ты навесишь на неё тонну проверок, это будет связано с dq)
источник

NN

No Name in Data Engineers
Да, в таком случае, конечно, знаю, просто с глоссарием ещё плохо знаком, спасибо)
источник

РП

Роман Пашкевич... in Data Engineers
Я выше и писал. DQE в продуктах занимается в том числе и качеством данных. Т.е. пилят необходимые проверки.
источник

NN

No Name in Data Engineers
+
Не вижу принципиально ничего нового в таком определении dqe
источник

NN

No Name in Data Engineers
У нас и так инженеры эти поверки пилят
источник

РП

Роман Пашкевич... in Data Engineers
И смысл в моем сообщении, был больше в том, что в каждой компании DQ\ DQ\ DE имеют разные стек технологий, и каждая компания по разному понимает и применяет эти аббревиатуры.
источник

AE

Alexey Evdokimov in Data Engineers
странно было бы, если бы совпадали
источник

AE

Alexey Evdokimov in Data Engineers
разная природа данных — разная головная боль, потому что и процессы каждый раз свои самобытные
источник

NN

No Name in Data Engineers
Это логично.
В моем понимании dq является неотъемлемой частью строительства пайплайна.
Да, конечно, в зависимости от задачи могут быть варианты - например, прибежит потный продакт и скажет, чтоб к утру новый источник вот лился позарез, потому что просрали все полимеры и аналитика нужна. Тут, конечно, придется dq в техдолг пихать.
Но, в целом, я плохо себе представляю работу над сырьем, если оно хоть минимальными метриками не покрыто.
источник

OI

Oleg Ilinsky in Data Engineers
- а какими DQ системами вы пользуетесь?
- заказчиком
источник

AK

Alexander Kozhevniko... in Data Engineers
хм… а есть системы dq?
источник

AE

Alexey Evdokimov in Data Engineers
в отдельных случаях пре-кукинг сырых данных может составлять 50% от всех задач бизнеса. мы вот enriched data перепродаём, например
источник

AK

Alexander Kozhevniko... in Data Engineers
я просто только начинаю и хотелось бы понять как это дело тестить 🙂
источник

AE

Alexey Evdokimov in Data Engineers
то есть цель ETL самого по себе это сделать из сырья что-то consumable
источник