Дано SIEM A – сборщик, SIEM B – обработчик.
Лог хранится на источнике событий в своем, внутреннем формате (БД, плоские файлы (XML, JSON, syslog)). Источники по типу хранения логов можно разделить на структурированные и неструктурированные. Структурированные – данные изначально нормализованы на уровне хранения (БД, XML…). Сборщик выгружает события тем или иным способом формируя датасет. Выбирая структурированные данные агент сборщика вынужден представить датасет в каком-то внутреннем формате. Если этого не сделать, придется на уровне правил нормализации оперировать бинарным объектом (тупо писать парсер бинарного блока). Внутренним форматом может быть тот же JSON, XML и т.д. Если собираем неструктурированные данные, то никакого представления не надо. Просто в нормализатор приходит строка текста.
Т.о. мы имеем агент Сборщика, и его выхлоп в виде датасета в том формате, который удобнее всего использовать для конкретной реализации нормализатора. В этом датасете вся структурированная инфа разложена в логике исключительно конкретного SIEM.