Всем привет.
Кто-то делал резервирование или высокую достпность на OCP (OpehShift 3.11/4.6) ?
Те, кто с aws/gc могут тут же слиться/сдуться - солюшин на коленках (vmware vsphere и даже не бармэтал)...
Так что реплицировать FS в 2 DC одновреммено пока не плучачается из-за лока на SMB v3, который не NFS и очень сцыкотно его сделать таковым.
Много букав и не факт что все прочтут дальше, но:
Есть 2-а DC кластера (1/2), NAS (который виндовый DFS и в 3.11/4.6 роняется при паении кластера в DC1).
Была процера DR: уронили в DC1 кластер, быстро поменяли DNS на DC2 и в течении 1-2 ч ( а может и 24ч) подняли с 0-ля (cold start) кластер в DC2 и рестором дампа с DC1 восстановили работу всех сервисов с новым DFS, что приехал с новым DNS...
Это не высокая доступность, так как даунтайм впечатляет и делает огромный стресс на почки, серце и так далее.
Вопрос, есть ли изящный солюшин для того, чтобы рестор на стороне Б был 15-30 мин максимум (hot-standby или repliica в DC2) ?
Сам придумал только semi-hot standby с использованем лейблом меток, но солюшин так себе, так как некоторые системные поды стартуют в DC2 (неактивном) и из-за этого перформенс кластера очень сильно страдает.
Буду рад любому холли вару.