У управляющих нодов должен быть бэкап, переключающий на себя запросы параллельных инстансов, чтобы другой нод мог за это время запроцессить накопившиеся задачи
Ну вы сам сетевые вопросы качества связи и прохождения сигнала туда обратно урегулируйте, без надёжной связи все серверное взаимодействие коту под хвост
Считаю, что если есть возможность, надо задействовать сервера предыдущего поколения - они на короткий срок вполне справляются с нагрузкой при техобслуживании обычных нод