Size: a a a

2021 September 29

ЕГ

Евгений Глотов... in Data Engineers
Показывай, что не работает, ща разберёмся)
источник

D

Dmitry in Data Engineers
поставлю mysql
источник

BT

Boris Tyshkevich in Data Engineers
вот так и сведу, чтобы в BI было то что нужно, а не что придумали разработчики 10 лет назад.  Аттрибуты придется долго и муторно мапить к общему знаменателю.
источник

AS

Andrey Smirnov in Data Engineers
В 3 спарке добавили спец. поддержку звездочки
источник

AZ

Anton Zadorozhniy in Data Engineers
Меньше задержки на старте, меньше накладные на управление памятью, больше утилизация - они считают им этого хватит
источник

A

Aleksey in Data Engineers
боюсь только этот шаг не сильно поможет 🙂
источник

A

Aleksey in Data Engineers
кому нужно? Рознице, опту, e-commerce, финансам, маркетингу, логистике?
источник

D

Dmitry in Data Engineers
это круто, я даже могу поверить что где-то аж 20% буста добавит, но шафл. шафл не даст эти миллиарды джойнов гонять как того требует DV, anchor и прочие
источник

AS

Andrey Smirnov in Data Engineers
Skew join
источник

ЕГ

Евгений Глотов... in Data Engineers
В 3 же добавили обработку
источник

D

Dmitry in Data Engineers
2021-09-29 04:04:53 WARN [Reporter] YarnAllocator:66 - Container killed by YARN for exceeding memory limits. 22.3 GB of 20 GB physical memory used. Consider boosting spark.yarn.executor.memoryOverhead or disabling yarn.nodemanager.vmem-check-enabled because of YARN-4714.
источник

AS

Andrey Smirnov in Data Engineers
Мы на 2.4
источник

ЕГ

Евгений Глотов... in Data Engineers
Spark.sql.shuffle.partitions=10000)
источник

AZ

Anton Zadorozhniy in Data Engineers
В моем кругу все архитектуры «нормализованный детальный слой с зависимыми витринами» называются инмоновским, то как сделана модель деталек (3NF/DV или что-то ещё) это частности
источник

AS

Andrey Smirnov in Data Engineers
А он зараза все равно в одну партицию хочет насовать кучу данных
источник

ЕГ

Евгений Глотов... in Data Engineers
Тогда ручками скю джойн сделать
источник

AZ

Anton Zadorozhniy in Data Engineers
Я тоже считаю что это не очень эффективно, но у них есть ОЧЕНЬ большие заказчики которые едят этот кактус и им нравится
источник

AZ

Anton Zadorozhniy in Data Engineers
(Витрины конечно материализуют)
источник

D

Dmitry in Data Engineers
на спарке тоже крупные заказчики. сути то это не меняет. там все неоднозначно. а джойны точно смерть
источник

AS

Andrey Smirnov in Data Engineers
скю?
источник