Size: a a a

Архитектура данных

2018 February 05

PG

Paul Golubev in Архитектура данных
А по anchor интересно, есть те, кто работал с ним, щупал на своих данных?
источник

RK

Roman Kolchin in Архитектура данных
Paul Golubev
А по anchor интересно, есть те, кто работал с ним, щупал на своих данных?
Есть мнение (не мое) — что оно для унификации и интеграции данных из кучи источников с постоянно меняющимися потребностями — это гут. А как источник данных непосредственно для работы аналитиков — большая боль.
источник

RK

Roman Kolchin in Архитектура данных
В Авито от "чисто анкор" в итоге пришли к созданию отдельных витрин для аналитиков от бизнеса — коммент с хабра от тамошнего архитектора https://habrahabr.ru/company/avito/blog/322510/#comment_10108768
источник

RK

Roman Kolchin in Архитектура данных
Из той же статьи — масштабы хранилища на анкоре в вертике в Авито на начало 2017 года
источник

PG

Paul Golubev in Архитектура данных
Эту статью многие прочитали. Но это один пример и на вертике. Я живым опытом интересуюсь
источник

PG

Paul Golubev in Архитектура данных
И сущностей там не очень много, хотя может уже поменялось за год
источник

e

er@essbase.ru in Архитектура данных
Paul Golubev
Эту статью многие прочитали. Но это один пример и на вертике. Я живым опытом интересуюсь
а чем заменить вертику ? что еще на рынке умеет кучу джойнов без шаманства с оптимизатором ?
источник

PG

Paul Golubev in Архитектура данных
Я работал с вертикой только пару месяцев без возможности залезть под капот. Впечатления на меня не произвело, хотя может она настроена была коряво
источник

IK

Ivan Kovalenko in Архитектура данных
Paul Golubev
Я работал с вертикой только пару месяцев без возможности залезть под капот. Впечатления на меня не произвело, хотя может она настроена была коряво
Один из профитов вертики для нас стало что мы ее практически не настраивали. Возможно это было связано с тем что мы всыпали туда ресурсов.
источник

v

vigo in Архитектура данных
айсберг?
источник

PG

Paul Golubev in Архитектура данных
Мне это больше напоминает картинку фронтэнд-бэкенд, только здесь данные)
источник

v

vigo in Архитектура данных
источник

PG

Paul Golubev in Архитектура данных
Кстати, пока искал картинку, наткнулся на давнишнюю статью Максима https://mxsmirnov.com/2012/05/05/как-документировать-базы-данных/  очень полезна. У кого как дела с этим обстоит на местах?
источник

RK

Roman Kolchin in Архитектура данных
Для документирования баз данных лучше всего подходят приложения управления метаданными, которые позволяют импортировать в себя структуру баз данных и прямо в этой системе вести ее описание, дополняя постепенно с помощью пользователей. Очень удачное решение этого класса — Alation https://alation.com/ #alation
источник

RK

Roman Kolchin in Архитектура данных
Скриншот с примером интерфейса Alation. Здесь приведено описание таблицы абстрактной базы данных. #alation
источник

RK

Roman Kolchin in Архитектура данных
На правах рекламы продолжу 😊 Alation умеет анализировать код вьюх и определять от каких таблиц они зависят, умеет импортировать историю запросов для определения наиболее популярных полей в запросах, определения пользователей, которые чаще всего делают запросы к тем или иным таблицам (предполагается, что эти пользователи — эксперты по данным; это работает конечно при условии, что каждый аналитик писал запросы под отдельной учеткой), умеет сканировать репозитории отчетов Tableau Server и Microstrategy и показывать связь между показателями отчетов до таблиц-источников, умеет все это делать и для Hadoop/Hive в том числе. #alation
источник

RK

Roman Kolchin in Архитектура данных
Интерфейс трассировки зависимости между вьюхой или отчетом и таблиц-источников. #alation
источник

RK

Roman Kolchin in Архитектура данных
Есть встроенная подсистема чатов — по любому объекту можно начать диалог с владельцами или экспертами и на любой объект в диаолге можно сослаться по сниплету @ и потом на странице объекта появится автоматом ссылка на этот диалог. #alation
источник

RK

Roman Kolchin in Архитектура данных
В общем, прогресс скакнул дальше общих репозиториев метаданных у PowerDesigner.
источник

RK

Roman Kolchin in Архитектура данных
Конец рекламной паузы :=)
источник