Телеграмм чат группы hadoopusers страница 3653

parrot.ru

Рейтинг популярных групп и каналов

В рейтинге участвует:

групп:

каналов:

Виртуальный сервер на SSD - недорого!

Аренда выделенных и виртуальных серверов (VDS/VPS), хостинг, аренда IP-адресов, администрирование, круглосуточная поддержка

qwarta.ru подробнее

Резервное копирование с проверкой на вирусы!!!

Удобный сервис создания резервных копий на любой сервер сети интернет. Отслеживайте изменения, проверяйте на вирусы. Надежно защитите свой бизнес!

go.backupland.com

Выбираете сервер? Любая конфигурация на заказ!

Аренда физических серверов любых конфигураций под любые запросы - 1С бухгалтерия, игровые сервера, нагруженные проекты, интернет-магазины!

qwarta.ru подробнее

Size: a a a

Data Engineers

2473 membersпожаловаться на группу

2021 May 19

V

Vladislav Gotsulyak in Data Engineers

+

источник

01:33пожаловаться #1

AB

Anatoly B in Data Engineers

salting тема, на YT регулярно не влезал в джобы, звучит полезно

источник

01:33пожаловаться #2

ЕГ

Евгений Глотов... in Data Engineers

Пайспарк пандас юдф

источник

01:33пожаловаться #3

V

Vladislav Gotsulyak in Data Engineers

👍🏻

источник

01:34пожаловаться #4

AB

Anatoly B in Data Engineers

👍всем спасибо, есть над чем подумать)

источник

01:35пожаловаться #5

A

Anton in Data Engineers

нашел предполоджение, что его через докер ставят - попробуем наверное с этого начать

источник

02:30пожаловаться #6

A

Anton in Data Engineers

уже не хватает его - много процессов, код на питоне - очень не удобно администрировать становится

источник

02:31пожаловаться #7

A

Anton in Data Engineers

информатики нет)

источник

02:31пожаловаться #8

A

Anton in Data Engineers

airflow приглянулся своей красотой и опенсорсностью)

источник

02:32пожаловаться #9

A

Anton in Data Engineers

такое тоже находил - судя по всему тоже буду рассматривать как вариант - пробовать ставить

источник

02:35пожаловаться #10

T

T in Data Engineers

Дошел, у них кстати самая приятная дока из всех 3х

источник

09:29пожаловаться #11

T

T in Data Engineers

И презенташки отличные от уберевцев, намного интересней чем у дельты, имхо

источник

09:37пожаловаться #12

АР

Андрей Романов... in Data Engineers

а вы случаем не будете статью с сравнением форматов делать?

источник

09:38пожаловаться #13

АР

Андрей Романов... in Data Engineers

было бы полезно с актуальными метриками, так сказать

источник

09:39пожаловаться #14

T

T in Data Engineers

Если до бечмарков дойдет попрошу ребят в блоге компании написать и скину сюда. Без бечмарков таких статей уже достаточно много

источник

09:39пожаловаться #15

АР

Андрей Романов... in Data Engineers

спасибо!

источник

09:40пожаловаться #16

AZ

Anton Zadorozhniy in Data Engineers

Айсберг пока ставит функциональность и корректность в приоритет, без merge-on-read фактически нет работающей потокового upsert (и вообще потоковая запись пока в зачаточном виде, не надо его использовать для этого)

источник

09:52пожаловаться #17

AZ

Anton Zadorozhniy in Data Engineers

я видел такую логику:
- если датабрикс - дельта
- если нужна потоковая запись и апсерт - худи
- для больших (объем и номенклатура) даталейков - айсберг

источник

09:53пожаловаться #18

T

T in Data Engineers

О я вчера точно к тому же выводу пришел

источник

10:02пожаловаться #19

AZ

Anton Zadorozhniy in Data Engineers

ну и плюс айсберг потихоньку получает хорошую поддержку AWS, уже Glue и Athena с ним работают, у Google в Dataproc он есть в образе (дельта там тоже есть, но худи они выкинули)

источник

10:02пожаловаться #20