Size: a a a

2020 March 31

AZ

Anton Zadorozhniy in Data Engineers
KrivdaTheTriewe
хранимые процедуры не ереносимы
логика на спарке не переносима, решили мы на бим поехать - куда деваться?
источник

K

KrivdaTheTriewe in Data Engineers
Anton Zadorozhniy
логика на спарке не переносима, решили мы на бим поехать - куда деваться?
бим более примитивный продукт и менее переносимый
источник

AZ

Anton Zadorozhniy in Data Engineers
KrivdaTheTriewe
бим более примитивный продукт и менее переносимый
расскажите это несчастным пользователям dataflow, как они мучаются бедные
источник

AZ

Anton Zadorozhniy in Data Engineers
ну и по поводу меньше переносимости бим - это толсто )
источник

K

KrivdaTheTriewe in Data Engineers
Anton Zadorozhniy
ну и по поводу меньше переносимости бим - это толсто )
источник

AZ

Anton Zadorozhniy in Data Engineers
а где такая табличка для Spark?
источник

K

KrivdaTheTriewe in Data Engineers
нету
источник

AZ

Anton Zadorozhniy in Data Engineers
то есть спарк получается непереносим?
источник

K

KrivdaTheTriewe in Data Engineers
получается , что спарк инструмент с открытым исходным кодом, который  опережает все аналоги по всем параметрам, но да , получается также, что  я загнал себя в логическую ловушку и непереносим
источник

AZ

Anton Zadorozhniy in Data Engineers
KrivdaTheTriewe
получается , что спарк инструмент с открытым исходным кодом, который  опережает все аналоги по всем параметрам, но да , получается также, что  я загнал себя в логическую ловушку и непереносим
ну ладно, не грустите, я вас завел туда)
источник

K

KrivdaTheTriewe in Data Engineers
мне н особо нравится, что для стандартных задач( выгрузка порции данных), нужно каждый раз писать код
источник

K

KrivdaTheTriewe in Data Engineers
это все менеджится
источник

AZ

Anton Zadorozhniy in Data Engineers
нужно один раз написать (или дописать чужое) и использовать
источник

K

KrivdaTheTriewe in Data Engineers
ну вот у меня пока на спарке написано
источник

AZ

Anton Zadorozhniy in Data Engineers
я во всех больших даталейках вижу либо полностью свой  пакетный инджест тулинг, либо что-то настолько до неузнавания дописанное что узнать что там внутри невозможно (и это никогда не спарк)
источник

AZ

Anton Zadorozhniy in Data Engineers
ну или проприетарщину вроде того же abinitio
источник

AZ

Anton Zadorozhniy in Data Engineers
а вам попадались случаи тысяч и десятков тысяч мелких таблиц? не жалко это спарком обстукивать?
источник

K

KrivdaTheTriewe in Data Engineers
Anton Zadorozhniy
а вам попадались случаи тысяч и десятков тысяч мелких таблиц? не жалко это спарком обстукивать?
да
источник

K

KrivdaTheTriewe in Data Engineers
попадались
источник

K

KrivdaTheTriewe in Data Engineers
если  одной схемы
источник