А чем мониторится обычно? Как понять причины?
У нас графана + Прометей, собираем системные метрики через node exporter (cpu/ram/disk) + postgres exporter(дашбордов под него полно, можно увидеть все что захочешь + можно собственные метрики описать)
Там уже смотрим, делаем анализ, начинаем крутить параметры базы, смотрим статистику запросов, смотрим их планы, думаем как оптимизировать