запас по определению между пиковой нагрузкой и максимальной производительностью, причем тут среднее?
Запаса между пиковой и максимальной нагрузки нет вообще. По этому отталкиваются от средних значений с учётом ваших timeframe. Вот разница между пиковыми и средними значениями и есть тот самый запас и опять же с учётом timeframe. И процентовка утилизаций ваще не является показателем нагрузки. Как при использовании cpu, так и io. Ключевым фактором является latency