потому что микросервисы это всегда множество вызовов между сервисами (или сервисами и шиной), а это долго.
Быстрее эти же вызовы погрузить в память, желательно локальную для всех компонент... а это не просто монолит, это в идеале один процесс.
В пределе, разумеется
Для этого шины все строятся на пакетном обмене данными. Если в классическом стеке вы группируете данные по ниткам бизнес-логики, то в микросервисах вы группируете данные по рабочей области. Это работает медленнее на малых объёмах, зато повышение нагрузки с повышением объёма не прямое, и это позволяет дольше жить на имеющихса ресурсах, а при горизонтальном масштабировании фокусироваться именно на масштабировании узких мест.