Size: a a a

2021 June 03

S

Stanislav in Data Engineers
согласен
сама постановка задачи и архитектура заставляет ходить каждый вечер к психотерапевту
зачем в такое вписываться
источник

S

Stanislav in Data Engineers
а потом 6 часов писали, 6 часов читали
зато каналы по пути заняты, диски работают, планету отапливаем
источник

AZ

Anton Zadorozhniy in Data Engineers
это был один из тех редких случаев когда в одной комнате были четыре phd, и три phd пытаются убедить четвертого что батч это хорошо, это оптимизация, целостность, идемпотентность (простите).. а четвертый говорит "ну зато стриминг же!" 😊
источник

AZ

Anton Zadorozhniy in Data Engineers
гениальное решение для контроля целостности: "мы допишем в каждое сообщение технические метаданные, из какого датасета запись, сколько их там всего и какая эта запись по номеру (!), более того мы сделаем ключ из этих технических метаданных, так что наши топики в кафке нельзя будет использовать для доступа по бизнес-ключу"
источник

V

Vasiliy in Data Engineers
"И выбьем это все в камне"
источник

V

Vasiliy in Data Engineers
Простите, не удержался)
источник

АЖ

Андрей Жуков... in Data Engineers
Ты что, с нашими архитекторами общаешься???
источник

AZ

Anton Zadorozhniy in Data Engineers
Мои соболезнования
источник

АЖ

Андрей Жуков... in Data Engineers
Не, они уже в Сбер ушли
источник

AZ

Anton Zadorozhniy in Data Engineers
Ну значит все к лучшему
источник

AZ

Anton Zadorozhniy in Data Engineers
Я слышал там много лишнего железа, надо его чём-то загружать
источник

K

KrivdaTheTriewe in Data Engineers
Нужно проверить кстати
источник

K

KrivdaTheTriewe in Data Engineers
В целом можно действительно пересоздавать стрим
источник

K

KrivdaTheTriewe in Data Engineers
Но я прям тут вижу у людей бед дизайн
источник

NN

No Name in Data Engineers
Сори за нубство, а без стриминга батчами в Кафку не проще грузить? И вообще, это адекватный паттерн использования Кафки?
источник

AZ

Anton Zadorozhniy in Data Engineers
Паттерны и архитектура не висят в воздухе, они привязаны к каким-то требованиям; вопрос в том что люди хотят реализовывать так
источник

AZ

Anton Zadorozhniy in Data Engineers
в моем случае требование было "ну мы очень хотим", клиент заплатил много денег чтобы я их отговаривал, а потом еще чтобы это хоть как-то заставил работать - в таком случае паттерн адекватный, но я второй раз делать не буду
источник

NN

No Name in Data Engineers
Ну, помимо этого же все таки существует паттерн использования инструмента. Да, конечно, мы можем забивать гвозди микроскопом, и ловить рыбу брюками, но есть же понимание, что целевое назначение у них другое, а под забивание гвоздей и рыбалку есть куда более подходящие инструменты. В этом смысле разве стриминг спарком хадупной таблицы, которая батчево грузится раз в день - это норм? А дальнейшее прокидывание этого подарка в Кафку, вместо того, чтобы, грубо, батчево загрузить это куда-то на сторону клиента/дать доступ по jdbc к реплике/выгрузить файлы в какое-то файловое хранилище?
источник

S

Stanislav in Data Engineers
тебе бы барин в крупный энтерпрайз, хотя бы телеком
вот там бы ты впечатал себе рукувлицо )
источник

S

Stanislav in Data Engineers
15 млн раз сделать рест апи запрос вместо обмена цсвшчкой - да пожалуйста )
источник