Тестирование сложно же. Во-первых не вся виртуализация дает возможность все протестировать, у некоторых вендоров нет виртуального образа, который можно включить в pipeline. Физический стенд обычно сильно ограничен в размере.
Беда ещё и в том, что лично я - дебил. И если я меняю хотя бы капельку - редко я делаю все правильно с первого раза. Обычно - с десятого. В итоге - каждый чих проходит через вагон код ревью, прежде чем он станет работоспособен