Size: a a a

Архитектура данных

2020 June 10

Н

Николай in Архитектура данных
соломоново решение. а уж как там стейж организован вообще никого не интересует
источник

VS

Vladislav 👻 Shishkov... in Архитектура данных
получается просто следующее: вы разбили на под этапы ETL/ELT, чтобы их упростить как в сопровождении, так и в разработке
источник

VS

Vladislav 👻 Shishkov... in Архитектура данных
вам легче внести данные в rawDV и при этом отдельно проще внести данные из rawDV в BDV
источник

VS

Vladislav 👻 Shishkov... in Архитектура данных
что-то похожее на "микросервис", как нынче любят говорить
источник

VS

Vladislav 👻 Shishkov... in Архитектура данных
вопрос только, сколько времени это будет работать, и какой процент данных в BDV нужен готовым asap
источник

VS

Vladislav 👻 Shishkov... in Архитектура данных
если у вас требование, чтобы весь BDV был готов, то распиливать нет смысла, а если требование всего лишь по паре сущностей, то распил позволит более точечно разделить нагрузку загрузки данных на каждом слое
источник

VS

Vladislav 👻 Shishkov... in Архитектура данных
моя практика говорит о том, что целиком BDV требуется гораздо позже, нежели какие-то срочные сущности
источник

A

Alexander in Архитектура данных
если исходить в моем вопросе из того, что raw dv вырождается в stage (просто хранит данные немного по-другому разложенные, в отличие от источника). то мы все-равно уже храним данные в  stage (первоначальном) в том формате, в котором они приехали из источника. Не получается тут трансформация ради транформации? Ведь никакой прикладной пользы data vault stage, вроде бы не дает, кроме "унифицированной" модели
источник

A

Alexander in Архитектура данных
Владислав, и спасибо большое за развернутый ответ)
источник

VS

Vladislav 👻 Shishkov... in Архитектура данных
Alexander
если исходить в моем вопросе из того, что raw dv вырождается в stage (просто хранит данные немного по-другому разложенные, в отличие от источника). то мы все-равно уже храним данные в  stage (первоначальном) в том формате, в котором они приехали из источника. Не получается тут трансформация ради транформации? Ведь никакой прикладной пользы data vault stage, вроде бы не дает, кроме "унифицированной" модели
Как вариант, отказаться от stage, в пользу raw DV, но тут вам надо самим взвесить, на сколько сложнее будет все остальное из-за "легких" трансформаций на этапе забора данных из источника
источник

VS

Vladislav 👻 Shishkov... in Архитектура данных
Я подобное в одном хранилище реализовывал, в целом, классический stage сводиться просто к temp таблицам, а потом при помощи ELT быстро раскидывал на сырой слой
источник

PG

Paul Golubev in Архитектура данных
В dv при реализованном raw область stage просто сводится к landing зоне инкремента, а вся история хранится в формате dv. Оно удобно тем, что можно места меньше занять, чем в исходном формате, а также тем, что в bdv более удобно складывать. Но можно из полновесного stage просто в bdv сразу качать
источник

VS

Vladislav 👻 Shishkov... in Архитектура данных
именно так
источник

A

Alexander in Архитектура данных
понял, всем спасибо!
источник
2020 June 14

e

er@essbase.ru in Архитектура данных
er@essbase.ru
Вот тружусь над домашним ОпенСоурс -  делаю  универсального клиента к реляционным базам  в Excel

если кто то видит что подобное пригодится в работе и готов потратить пару часов на бето - тестирование - то я готов "заточить" инструмент под ваши задачи . (добавить "экзотику" как источник и пр. )
* стучитесь в  личку
Зарелизил бетку  на SF
https://sourceforge.net/projects/in2sql/
источник
2020 June 15

🅰

🅰️ртур in Архитектура данных
Привет! Посоветуйте, какая архитектура данных наиболее оптимальна в сфере ежемесячной абонплаты за предоставление услуг (ЖКХ, начислено-собрано, вх. и исх. сальдо)? Сейчас данные вручную из нескольких подразделений стекаются в итоговую Google таблицу. Есть потребность автоматизировать сбор данных для последующей визуализации.
источник

Н

Николай in Архитектура данных
Артур, вы практически спросили "что лучше Винда или Линукс" :)
источник

DL

Dmitry Lebedev in Архитектура данных
Николай
Артур, вы практически спросили "что лучше Винда или Линукс" :)
Обе плохи!
источник

Н

Николай in Архитектура данных
Dmitry Lebedev
Обе плохи!
только OS/2! только хардкор!
источник

🅰

🅰️ртур in Архитектура данных
Да, понимаю. Новичок, мне сложно сформулировать. Думаю, есть какая-то оптимальная связка, чтобы сорганизоваться на начальном этапе.
источник