zokie
Ну, методику, собственно, и надо написать, на проекте я единственный тестер и с отказоустойчивостью сталкиваюсь впервые)
Спасибо)
Стоит пояснить, почему уровень нагрузки должен быть НИЖЕ уровня максимальной производительности:
В тесте стабильности мы не стремимся завалить систему - мы стремимся предвидеть медленно проявляющиеся риски.
Потому что это тестовый стенд поработал и отдыхает, а прод работает всегда.
В первую очередь - мы хотим увидеть ухудшения в работе системы в зависимости от времени.
Это может быть, например:
- постепенное увеличение времён отклика или
- постепенное падение производительности
- рост утилизации памяти
- рост утилизации cpu
- накопление данных в очередях
- накопление количества тредов
И так далее.
А раз так - у нас должен быть запас по всем этим (и другим) показателям.
Ведь если cpu или память потрачены на 100% - никакого «постепенного накопления» увидеть вы не сможете.
Если производительность уже на пределе - то малейшее её увеличение может «завалить» всю систему.
Ну, соответственно, если вы пуляете нагрузку ниже ПРОДУКТИВНОЙ - вы не проверяете риски прода.
Так что для теста стабильности уровень нагрузки выбирается где-то между:
- текущей продуктивной
- максперф минус 20% (примерно)
Обычно берут побольше прода всё-таки, что бы смотреть в будущее.