пока не знаю. зависит от следующих 2 недель. тащить вопрос без половины ответа я уже утомился. на bmm его задавал. зал был в глубокой прострации от самой постановки вопроса. примерно как ты немного выше
что можно решать в принципе понятно. пересоздание нод при ошибке, перезапуск сервисов, чистка кешей, скейлинг всякого, добавление удаление ресурсов (api point например) такое.