Size: a a a

2021 September 29

A

Aleksey in Data Engineers
зачем вообще КХ в этой схеме - можно поверх системы источника все строить и данные перегружать никуда не нужно.
источник

BT

Boris Tyshkevich in Data Engineers
нельзя :)
источник

A

Aleksey in Data Engineers
тогда Excel и тоже будет счастье.
источник

BT

Boris Tyshkevich in Data Engineers
и гугль докс.  кому-то вполне подходит.
источник

D

Dmitry in Data Engineers
а разве в эпоху дата лейков так кто-то еще делает ? ну кроме как на террадате ? я не понтуюсь, но вроде все новомодное, начиная со спарка, заканчивая КХ не любит же джойны. и хадуп, уже не новомодный, не любит
источник

AZ

Anton Zadorozhniy in Data Engineers
Извините, мне просто кажется вы не полностью понимаете в чем основные преимущества инмоновской архитектуры с зависимыми витринами, мб вам кажется что это лишнее, но по моему опыту начиная с определённого масштаба независимые витрины становятся абсолютно неуправляемым снежным комом
источник

AZ

Anton Zadorozhniy in Data Engineers
DV, anchor modeling, помянутый activity stream - это все продолжение этих идей
источник

BT

Boris Tyshkevich in Data Engineers
ключевое тут "начиная с определённого масштаба". Да, есть в мире компании, в которых работает менее 1000 сотрудников, и они никогда не поставят террадату и прочие.
источник

D

Dmitry in Data Engineers
ну да, но там же джойн на джойне, джойном погоняет. разве такое взлетит на databriks и его spark ?
источник

A

Aleksey in Data Engineers
джойты то системы могут не любить, но когда у нас большая номенклатура систем-источников и данные там разрознены, то как без джойнов?
источник

AZ

Anton Zadorozhniy in Data Engineers
Они все переписали на кресты и симд ровно чтобы такое заработало)
источник

BT

Boris Tyshkevich in Data Engineers
совсем без джойнов - никак.  Но надо же знать меру!
источник

A

Aleksey in Data Engineers
ну если и данных у них толком нет (я про номенклатуру), то для них это будет лишним.
источник

D

Dmitry in Data Engineers
ну как, не увлекаться нормализацией
источник

AZ

Anton Zadorozhniy in Data Engineers
Я с этим не спорю, вы же предлагали закапывать инмона без оговорок про масштабы
источник

BT

Boris Tyshkevich in Data Engineers
ну все-таки я предлагал инмона закапывать, а не DV/anchor ?
источник

D

Dmitry in Data Engineers
а чего это вдруг им кресты помогут ? шафлинг никуда не делся, какая разница кресты это или jvm делает, успеха то не будет
источник

ЕГ

Евгений Глотов... in Data Engineers
В спарке джойны работают без проблем, просто долго🤷‍♂
источник

D

Dmitry in Data Engineers
я первые три года со спраком в это верил
источник

A

Aleksey in Data Engineers
вот у вас есть 3 разные системы в одной из них продажи с офлайн магазинов, в другой оптовые, в 3й интернет. У всех разные атрибуты. Как все будете сводить воедино, еще и с общей схемой? Чтобы, например со стороны BI им было удобно все анализировать.
источник