Всем привет! Вопрос про Business Data Vault. Извините, что очень длинно. Пользователи витрин будут оперировать бизнес-ключами, которые в системе-источнике размазаны по нескольким сущностям (причем по нетривиальным правилам), а теперь требуется все это собрать в одной витрине. И у нас две противоположные точки зрения сформировались:
1. Строим в Raw DV модель, которая максимально отвечает требованиям репортинга: создаем правильные с точки зрения репортинга хабы (один хаб на один бизнес-ключ, пусть ключи и размазаны в системе источнике по разным сущностям) и заморачиваемся с трансформацией данных при перекладывании данных из stage в Raw. А для построения Business DV расширяем модель PIT, Bridge и т.п. суррогатами для перформанса.
2. В Raw DV создаем модель максимально похожую на операционную модель данных (получается сырое хранилище всего, что только можно, но в модели DV. На то он и "Raw"). А потом по данным из Raw DV строим отдельную модель (новые хабы, линки, саттелиты) в Business DV. Получается data vault над data vault с какими-то суррогатными хабами и выглядит это несколько дико. И как переливать данные между слоями и т.п. не очень понятно.
Мы уже ходим кругами в обсуждениях и пора уже выбрать что-то. Можете подтвердить или опровергнуть правильность первого варианта, и прокомментировать второй? С data vault впервые все столкнулись на проекте)