Size: a a a

2020 March 27

TT

Tsh Tsh in Data Engineers
Поэтому data factory вроде нет
источник

T

T in Data Engineers
Кстати а у кого-нибудь получалось пробросить коментарий из glue в таблицу чтобы он show create table отображался?  а то мне пришлось костылить и закоментариями к колонке ходить через glue api
источник

TT

Tsh Tsh in Data Engineers
Anton Zadorozhniy
а как наполняете эти метасторы? есть какое-то общее хранилище метаданных откуда потом наливаете?
Я в общем больше в дата сотонизм и аналитику ударился, осточертела низкоуровневая возня с переливанием и потерей данных
источник

TT

Tsh Tsh in Data Engineers
Поэтому не скажу про glue
источник

AZ

Anton Zadorozhniy in Data Engineers
Tsh Tsh
Поэтому не скажу про glue
спасибо за ответы, полезно
источник

V

Vasiliy in Data Engineers
Tsh Tsh
Стабильно раз в месяц - два месяца все нахрен валится , все становится недоступным
Наблюдаю у своих коллег примерно тот же процесс, и в целом те кто неистово топил за МС и переезд со своими данными в течении пары лет обратно приехали и крестятся не переставая
источник

V

Vasiliy in Data Engineers
Есть, канеш, отдельные энтузиасты.. Но данных критичных там нет
источник
2020 March 28

N

Nick in Data Engineers
Кто знает, может есть хорошие курсы по DE (платные/бесплатные)?
источник

Y

Yurgen in Data Engineers
Хороших нет. Выброшенные деньги.
источник

AN

Anomalocaris Nathorsti in Data Engineers
Nick
Кто знает, может есть хорошие курсы по DE (платные/бесплатные)?
Есть курс на coursera от Яндекса.
источник

AN

Anomalocaris Nathorsti in Data Engineers
BigData for data engineers
источник

DZ

Dmitry Zuev in Data Engineers
На отвратительном английском местами
источник

VB

Vladimir Bystrov in Data Engineers
та не норм заходит, рашн инглиш
источник

R

Renarde in Data Engineers
Vladimir Bystrov
та не норм заходит, рашн инглиш
Нет, он там реально неистово плох, но объективно - курс немного устарел, зачем самостоятельно мапперы и редьюсеры писать в 2020
источник

R

Renarde in Data Engineers
Tsh Tsh
Датабрикс дорогой и у них есть привычка ничего не доделывать, после них либо все выбрасывать и с нуля, либо 50 % переделки
А что имеется в виду под «не доделывать»? Они же просто платформу дают, а вы уже с ней играетесь как вам удобно
источник

VB

Vladimir Bystrov in Data Engineers
Renarde
Нет, он там реально неистово плох, но объективно - курс немного устарел, зачем самостоятельно мапперы и редьюсеры писать в 2020
Я так понимаю для глубинного понимания как оно работает, плюс там и спарк + спарк SQL освещается в последующих курсах из специализации (курм по стримингу почему то уже пропал)
источник

AN

Anomalocaris Nathorsti in Data Engineers
Renarde
Нет, он там реально неистово плох, но объективно - курс немного устарел, зачем самостоятельно мапперы и редьюсеры писать в 2020
Там на Hadoop отведено 1-2 недели. А дальше spark sql , hive
источник

VB

Vladimir Bystrov in Data Engineers
Есть вопрос, посоветуйте что почитать по темам: data lineage и data governance
источник

SS

Sergey Sheremeta in Data Engineers
Vladimir Bystrov
Есть вопрос, посоветуйте что почитать по темам: data lineage и data governance
DAMA-DMBOK
источник

YI

Yukari I in Data Engineers
+
источник