Size: a a a

2021 June 30

rG

rpuropuu Greeg'O'Rii... in Data Engineers
Нужны лайв дашборды с кафки и с кассандры, как я понял.
источник

rG

rpuropuu Greeg'O'Rii... in Data Engineers
Спарк джоб добавлю в список изучения.. хз что это. Можете подсказать приоритеты по времени? Во что стоит вникать: спарк, кафка, кассандра, джоб.
источник

А

Александр in Data Engineers
Если данных много Табло на лайве не вывезет
У него есть механизм экстрактов - это более эфективно
источник

I

Ilya in Data Engineers
Data mart классическая штука. В любой книжке про DWH будет.
Там не только производительность и подготовленные заранее агрегаты, но ещё и безопасность. Например финансовый отдел - единственный, кто получает доступ к витрине с информацией про бабло, эйчар - к зарплатам сотрудников и т.д.
источник

I

Ilya in Data Engineers
Не надо. Потом обычно полный бардак и никто не понимает где бизнес логика
источник

rG

rpuropuu Greeg'O'Rii... in Data Engineers
Думаете? ( .. в амазоне видел он в схеме стоит, но там нет уточнения экстрактом или лайвом… так если экстрактом он же всё тянуть к себе начнет..
источник

I

Ilya in Data Engineers
SQL и Питон, остальное приложится
источник

А

Александр in Data Engineers
Есть инкрементальный экстракт
источник

rG

rpuropuu Greeg'O'Rii... in Data Engineers
Я думал это что-то типа обработки пандасом… ох
источник

rG

rpuropuu Greeg'O'Rii... in Data Engineers
Т.е. лайв работает, если не злоупотребить запросами?
источник

А

Александр in Data Engineers
Нее
источник

rG

rpuropuu Greeg'O'Rii... in Data Engineers
Уже пройдено)
источник

I

Ilya in Data Engineers
Не учите человека плохому. Табло - визуализация, все способы добавить туда обработку данных (экстракты и прочее) - зло. Это как в Экселе все делать. Просто и хочется, но в итоге потом черт ногу сломит.
Все экстракты должны быть в DWH: витрины или хотя бы materialized views
источник

I

Ilya in Data Engineers
Нет :)
источник

rG

rpuropuu Greeg'O'Rii... in Data Engineers
Уже где тотаидел эти слова))
источник

А

Александр in Data Engineers
Ну знаете ли, есть разница когда дашборд будет открываться 10 секунд или 1.5 минуты. У нас все данные посчитаны в dwh, но Табло работает на экстактах тк данных много, надо сравнивать например текущий год и предыдущие 5 лет. Лайв на таких обьемах скажет досвидания
источник

rG

rpuropuu Greeg'O'Rii... in Data Engineers
Ну да) опыта нет, только учебная практика разве) д задания с собесов) мне пандас нравится..
источник

rG

rpuropuu Greeg'O'Rii... in Data Engineers
А если табло пользует запущенный отдельно питон?
источник

rG

rpuropuu Greeg'O'Rii... in Data Engineers
И в питоне есть некие правила, например.
источник

I

Ilya in Data Engineers
Ну то есть у вас это про сути кэш?
источник