Size: a a a

2021 October 03

NN

No Name in Data Engineers
Ну для стриминга вообще норм тема, да.
Я хочу потестить и у нас, но есть сомнения, что для жирных батчей будет лучше айсберга.
источник

T

T in Data Engineers
У меня юзкейс как раз стриминговые апдейты поверх исторических данных накладывать. + Там не то что бы бигдата так что худи должен хорошо справиться
источник

NN

No Name in Data Engineers
Ну самое то, короче.
Я даже думаю, что тебе и бриксовый рантайм нафиг не нужен, убер же делал худи как раз под похожую модель бизнеса, даже более требовательную к рилтайму, как мне кажется.
источник

T

T in Data Engineers
Ну будь бы бриксовский рантайм можно было на Спарк стриминг писать прикрывшись им. А так прийдется флинк ковырять после отпуска
источник

NN

No Name in Data Engineers
Плохо, что ли?
источник

T

T in Data Engineers
Ну мне кажется конкретно для моей задачи Спарк стриминг подошёл бы лучше. Плюс уменя джоба которая готовит исторические данные на спарке. Мог бы часть кода переиспользовать, там очень красивый DSL получился
источник

NN

No Name in Data Engineers
Ну да, было бы элегантнее.
Блин, так редко слышу, что спарк стриминг лучше подходит, чем флинк)
источник

GP

Grigory Pomadchin in Data Engineers
Я ни разу не видел хорошего документированного кейса в природе с цифрами и примерами где одно лучше другого кстати и когда
источник

NN

No Name in Data Engineers
Ты про спарк стриминг и флинк конкретно?
Я тоже не видел, но я со стримингом и не сталкиваюсь на практике.
Зато постоянно вижу восхваление флинка и унижение спарк стриминга на словах.
источник

GP

Grigory Pomadchin in Data Engineers
да конкретно спарк стриминг вс флинк, интересно почитать о сравнении на разных и схожих задачах
источник

GP

Grigory Pomadchin in Data Engineers
сс @usualreptiloid может у тебя есть что?
источник

T

T in Data Engineers
Нее, у меня партия сказала Flink, комсомол ответил есть.
источник

T

T in Data Engineers
Ну вот для моей задача Спарк стриминг подошёл бы идеально, бери микро бачи да шлепай фул апдейты думаю там кода было бы строчек 5
источник

GP

Grigory Pomadchin in Data Engineers
а у спарка ж есть континус ещё
источник

T

T in Data Engineers
Эх, ну зато с флинком поиграюсь, это большой плюс
источник

ДА

Денис Ананьев... in Data Engineers
с цифрами есть вот такое, но это 2018 год
https://arxiv.org/pdf/1802.08496.pdf
или вот от алибабы, но особо без цифр
https://www.alibabacloud.com/blog/why-did-alibaba-choose-apache-flink-anyway_595190

свежих обзоров после добавления continuous processing в спарке не видел(
источник

GP

Grigory Pomadchin in Data Engineers
асаид алибабу это как датабрикосвые статьи): продают инхаус
источник

GP

Grigory Pomadchin in Data Engineers
но спс; да с континусом ещё больше вопросов конечно
источник

GP

Grigory Pomadchin in Data Engineers
эх
источник

GP

Grigory Pomadchin in Data Engineers
А поч кстате, из-за жавы?
источник