Size: a a a

2021 October 04

ПФ

Паша Финкельштейн... in Data Engineers
Учитывая то что inorder доставку обеспечить практически нереально timestamp не особенно спасает, нет?
источник

ЕГ

Евгений Глотов... in Data Engineers
Да тупо фильтрануть записи, которые обновились в запрашиваемый период
источник

AE

Alexey Evdokimov in Data Engineers
фильтрануть по ts > last_ts
источник

AE

Alexey Evdokimov in Data Engineers
и вставить что не отбросилось
источник

AE

Alexey Evdokimov in Data Engineers
jinx!
источник

ЕГ

Евгений Глотов... in Data Engineers
Ну если там апдейты есть, то уже либо худи, либо чёт другое
источник

ПФ

Паша Финкельштейн... in Data Engineers
Сработает только при inorder доставке. Иначе у тебя будут теряться айтемы, которые созданы раньше чем то, что записано
источник

ЕГ

Евгений Глотов... in Data Engineers
Не, ну бывает допустим качаешь хмл справочник на 30 гигов в зипе, и у него нет таймстемпа😆
источник

ЕГ

Евгений Глотов... in Data Engineers
А можно поподробнее про inorder?
источник

ПФ

Паша Финкельштейн... in Data Engineers
Ну доставка в строгом порядке
источник

ЕГ

Евгений Глотов... in Data Engineers
Как можно что-то потерять, если мы качаем пачками по дате например
источник

ЕГ

Евгений Глотов... in Data Engineers
Сегодня за вчера
источник

ПФ

Паша Финкельштейн... in Data Engineers
А, ну мы же про стриминг говорили вроде
источник

AE

Alexey Evdokimov in Data Engineers
если out of order, то зачем вообще делать вставку? можно дропнуть ранее набранное и заменить новым, с долитыми данными
источник

ЕГ

Евгений Глотов... in Data Engineers
Кстати да, нафиг вообще предыдущий срез🤔
источник

ЕГ

Евгений Глотов... in Data Engineers
Хотя, как раз понять, что поменялось
источник

AE

Alexey Evdokimov in Data Engineers
если же новый срез не полностью включает старый, то да, борода
источник

ПФ

Паша Финкельштейн... in Data Engineers
Если стриминг - то гарантировать сохранение хронологии в распределённой системе при более чем одном читателе по сути нереально
источник

ЕГ

Евгений Глотов... in Data Engineers
А откуда стриминг? Разве стримингом отправляют полносрез?😐
источник

ПФ

Паша Финкельштейн... in Data Engineers
Ну раз спрашивали про худи - я решил что вопрос о том, как нам добавлять те данные, которых ещё нет
источник