Size: a a a

2021 March 05

P

Pavel in Data Engineers
Igor  Master
А почему оффсеты в Кафке не хранить? librd - тема согласен
😳
источник

Igor  Master in Data Engineers
😮 я сказал какую-то дичь?
источник

P

Pavel in Data Engineers
Офсеты в кафке хранятся всегда
источник

P

Pavel in Data Engineers
Ну, можно включить хранение в zk
источник

Igor  Master in Data Engineers
ну это понятно но ведь спарк ими например не пользуется а пользуется своими чекпоинтами. В примере Антона librd тоже этого не делает а опять таки берет из файлов своих. Вот и вопрос зачем это делается? Если можно попросить метадату у Кафки и получить финальные оффсеты.
источник

P

Pavel in Data Engineers
Igor  Master
ну это понятно но ведь спарк ими например не пользуется а пользуется своими чекпоинтами. В примере Антона librd тоже этого не делает а опять таки берет из файлов своих. Вот и вопрос зачем это делается? Если можно попросить метадату у Кафки и получить финальные оффсеты.
Так в чем проблема) её можно попросить
источник

Igor  Master in Data Engineers
Так почему это спарк не делает
источник

Igor  Master in Data Engineers
Зачем вообще они придумали чекпоинтиться в s3
источник

Igor  Master in Data Engineers
Ты меня не понимаешь :(
источник

P

Pavel in Data Engineers
Igor  Master
Ты меня не понимаешь :(
Да. А вы - спарк
источник

Igor  Master in Data Engineers
А по существу зачем спарк тянет оффсеты из checkpoint'ов?
источник

t

tenKe in Data Engineers
Igor  Master
А по существу зачем спарк тянет оффсеты из checkpoint'ов?
потому что он умеет стримить не только из кафки и им из коробки нужен универсальный подход к управлению чекпоинтами
источник

t

tenKe in Data Engineers
если есть желание использовать оффсеты в кафке, то это можно реализовать достаточно быстро
источник

Igor  Master in Data Engineers
Вот спасибо
источник

Igor  Master in Data Engineers
Чего то я забыл совсем про то что оно умеет не только кафку читать.
источник

P

Pavel in Data Engineers
источник

AZ

Anton Zadorozhniy in Data Engineers
diversity hire наверное
источник

AT

Al T in Data Engineers
пайплайн сломался наверно
источник

Igor  Master in Data Engineers
В чате становится жарче
источник

AB

Andrey Bel in Data Engineers
Igor  Master
В чате становится жарче
👍👍😂😂
источник