Size: a a a

2019 June 25

D

Dmitriy in Data Engineers
Stanislav
Конкретно про пропажу рассказывала Оля на ок.толкс из иви. Но там скорее негарантированная доставка данных - отправили батч, кх ответил ок, данных в базе нет
Нет и не появились, или нет в момент обращения. Здесь важны нюансы.
источник

A

Alex in Data Engineers
нет и не появится
источник

A

Alexander in Data Engineers
Нюансы все же важны - какой движок, кафка там может
источник

AS

Andrey Smirnov in Data Engineers
Alexander
Нюансы все же важны - какой движок, кафка там может
там еще с версиями kх можно упороться, они их штампуют, потом правят баги, не надо гнаться за последними
источник

A

Alexander in Data Engineers
Stanislav
Конкретно про пропажу рассказывала Оля на ок.толкс из иви. Но там скорее негарантированная доставка данных - отправили батч, кх ответил ок, данных в базе нет
А можете ссылкой поделиться, не нахожу с наскока
источник

D

Dmitriy in Data Engineers
В таком случае как витрина сгодится, как перманентное хранилище... ну такое.
источник

S

Stanislav in Data Engineers
Alexander
А можете ссылкой поделиться, не нахожу с наскока
не было записи митапа, и слайды не выложили - я просил.
ну и похоже здесь нет Оли
может кто из иви есть
проще наверное пойти в чатик кх и там спросить
источник

S

Stanislav in Data Engineers
данных не было в базе
источник

GG

George Gaál in Data Engineers
ну, КХ - про консистенси евенчуалли
источник

S

Stanislav in Data Engineers
касалось крупных батчей, на которые они ставили мониторинг (этовроде около 60 млн за раз)
мелочь не мониторили, поэтому что там происходит - хз
источник

A

Alexander in Data Engineers
Попробую в кх чатике разузнать, спасибо
источник

D

Dmitriy in Data Engineers
George Gaál
ну, КХ - про консистенси евенчуалли
евенчуалли - это значит, данные появятся в течение некоего промежутка времени
источник

GG

George Gaál in Data Engineers
Обычно - да
источник

GG

George Gaál in Data Engineers
никто же КХ не использует в режиме стенделоун ноды на больших дата сетах
источник

GG

George Gaál in Data Engineers
а в кластере
источник

GG

George Gaál in Data Engineers
когда-нибудь данные должны докатиться, но это когда-нибудь может быть в бесконечности в будущем )
источник

D

Dmitriy in Data Engineers
Если я правильно понимаю, то здесь они не появятся никогда без повторного вмешательства со стороны дополнительной бизнес логики.
источник

OP

O. Petr in Data Engineers
Есть способы вызвать запись broadcast переменных перед прерыванием стрима спарка ?
источник

S

Stanislav in Data Engineers
George Gaál
никто же КХ не использует в режиме стенделоун ноды на больших дата сетах
Зависит от величины. Большие датасеты с сжатием кх - мало у кого есть настолько большие датасеты. Вполне себе кейс
источник

LV

Lena Varlamova in Data Engineers
Alexander
Мы кх гоняем больше года в проде, мне действительно любопытно, есть ли конкретные кейсы, когда данные пропадают или портятся, без общих отсылок
У нас он 3 года, ни разу данные не пропадали, все ок.
источник