Термин «катастрофоустойчивость» вызывает смутные ассоциации с недетерминистичной термодинамикой, странными аттракторами, точками бифуркации и прочей шнягой, благополучно забытой ещё на пятом курсе. Мне казалось, что все эти вещи живут только в книгах Ильи Пригожина, а не в контексте безопасности АСУТП
Мне приходило вполне себе чёткое ТЗ, требующее вменяемое время отклика при недоступности/выхода из строя ЦОДа. Через полное резервирование, репликацию и Round robbin DNS / CDN. Возможно, тема - больше для чата 187-ФЗ (например, транспортников и медицины), но там не столь демократичная атмосфера для обсуждения катастрофоустойчивости, имхо