Size: a a a

OpenShift - русскоязычное сообщество

2021 January 22

СЗ

Сергей Заикин... in OpenShift - русскоязычное сообщество
спасибо
источник

n

neb0t in OpenShift - русскоязычное сообщество
Всем привет.
Кто-то делал резервирование или высокую достпность на OCP (OpehShift 3.11/4.6) ?

Те, кто с aws/gc могут тут же слиться/сдуться - солюшин на коленках (vmware vsphere и даже не бармэтал)...
Так что реплицировать FS в 2 DC одновреммено пока не плучачается из-за лока на SMB v3, который не NFS и очень сцыкотно его сделать таковым.

Много букав и не факт что все прочтут дальше, но:
Есть 2-а DC кластера (1/2), NAS (который виндовый DFS и в 3.11/4.6 роняется при паении кластера в DC1).
Была процера DR: уронили в DC1 кластер, быстро поменяли DNS на DC2 и в течении 1-2 ч ( а может и 24ч) подняли с 0-ля (cold start) кластер в  DC2 и рестором дампа с DC1 восстановили работу всех сервисов с новым DFS, что приехал с новым DNS...
Это не высокая доступность, так как даунтайм впечатляет и делает огромный стресс на почки, серце и так далее.

Вопрос, есть ли изящный солюшин для того, чтобы рестор на стороне Б был 15-30 мин максимум (hot-standby или repliica в DC2) ?
Сам придумал только semi-hot standby с использованем лейблом меток, но солюшин так себе, так как некоторые системные поды стартуют в DC2 (неактивном) и из-за этого перформенс кластера очень сильно страдает.

Буду рад любому холли вару.
источник

n

neb0t in OpenShift - русскоязычное сообщество
Добавлю - модно еще девелоперов попросить наговнить кода, чтобы app сам определял какой DFS и достпный ли pvc, но очень не хотелось бы так как время девов денег стоит 😄
источник

n

neb0t in OpenShift - русскоязычное сообщество
И да - вопрос интересный - OCP 4.7 должен из коробки поддерживать ремоунт SMB через CSI smb... А пока, ядро не умеет ... И на центосе примонтировать обратно не получиться без велосипеда
источник
2021 January 23

СЗ

Сергей Заикин... in OpenShift - русскоязычное сообщество
Держать все конфиги в гите, применять через argocd например, чтобы ускорить миграцию,  централизованно применять изменения.
Smb странная штука имхо, я бы попробовал async replica на ceph.

Ну и dns балансер прикручивать чтобы автоматом фейловерил

https://docs.ceph.com/en/latest/rbd/rbd-mirroring/
источник

AG

Alex Gluck in OpenShift - русскоязычное сообщество
Vadim Rutkovsky
напиши им баг тогда
источник

bh

billy bob harley in OpenShift - русскоязычное сообщество
neb0t
Всем привет.
Кто-то делал резервирование или высокую достпность на OCP (OpehShift 3.11/4.6) ?

Те, кто с aws/gc могут тут же слиться/сдуться - солюшин на коленках (vmware vsphere и даже не бармэтал)...
Так что реплицировать FS в 2 DC одновреммено пока не плучачается из-за лока на SMB v3, который не NFS и очень сцыкотно его сделать таковым.

Много букав и не факт что все прочтут дальше, но:
Есть 2-а DC кластера (1/2), NAS (который виндовый DFS и в 3.11/4.6 роняется при паении кластера в DC1).
Была процера DR: уронили в DC1 кластер, быстро поменяли DNS на DC2 и в течении 1-2 ч ( а может и 24ч) подняли с 0-ля (cold start) кластер в  DC2 и рестором дампа с DC1 восстановили работу всех сервисов с новым DFS, что приехал с новым DNS...
Это не высокая доступность, так как даунтайм впечатляет и делает огромный стресс на почки, серце и так далее.

Вопрос, есть ли изящный солюшин для того, чтобы рестор на стороне Б был 15-30 мин максимум (hot-standby или repliica в DC2) ?
Сам придумал только semi-hot standby с использованем лейблом меток, но солюшин так себе, так как некоторые системные поды стартуют в DC2 (неактивном) и из-за этого перформенс кластера очень сильно страдает.

Буду рад любому холли вару.
Держали по кластеру в ДЦ. Деплоили сразу в 2 кластера. При переключении просто меняли днс у точки входа. Файловые шары синкали средствами операционной системы.
источник

JS

John Smith in OpenShift - русскоязычное сообщество
billy bob harley
Держали по кластеру в ДЦ. Деплоили сразу в 2 кластера. При переключении просто меняли днс у точки входа. Файловые шары синкали средствами операционной системы.
а через днс не медленно ли переключение происходило?
источник

bh

billy bob harley in OpenShift - русскоязычное сообщество
John Smith
а через днс не медленно ли переключение происходило?
Dns наши, корпоративные. Меняем внутренние днсы.
источник

JS

John Smith in OpenShift - русскоязычное сообщество
billy bob harley
Dns наши, корпоративные. Меняем внутренние днсы.
да это-то понятно.
просто всё равно ж где-то есть балансер/маршрутизатор, на который летит трафик извне, и до него-то обновления DNS записей же не сразу дойдут.
источник

bh

billy bob harley in OpenShift - русскоязычное сообщество
Ну секунда-две может,что-то и пропадает, хотя я не замечал. Но это лучше чем размазывать кластер на два дата центра.
источник

JS

John Smith in OpenShift - русскоязычное сообщество
а почему бы просто на балансере не переключать?
источник

n

neb0t in OpenShift - русскоязычное сообщество
dfs центос 7 еще не аучился автоматом перемонтировть. Сентос 8 с последним ядром - тот умеет, но оцр 4.6 имеет старую версию ядра - после смены днс на файл шару - монтируется пустой PVC ... нету ошибок кроме как в dmesg систпа репортирует что файлшара недоступна по старому ИР.
Это ограничение csi-smb драйвера... Убивать под с fstab просто нельзя, так как не подымутся тогда поды.
Окай, спасибо за пищу для размешлений @Kendepp  Vic
источник

n

neb0t in OpenShift - русскоязычное сообщество
на балансере переключение не проблема - проблема с перформенсом, если деплоить сразу в 2 кластера, так как поды постоянно к базе данных обращаются и при 2 актывных дц перформанса не будет.
источник

n

neb0t in OpenShift - русскоязычное сообщество
код хранитса в гите - не проблема поднять кластер с 0, просто может есть еще какие-то подходы проверены на проде. хотя бы хай левел, так как у каждого свой софт и способ развертвывания
источник
2021 January 25

BB

Boriss Borisovich in OpenShift - русскоязычное сообщество
Roman Tsisyk
Мы metalb используем
вы просто металлб юзаете? лб сервис без ингресса?
источник

dm

dmi3 mis in OpenShift - русскоязычное сообщество
Ребят здравствуйте! Захожу тут на сайт https://operatorhub.io/ и вижу чистый лист. Сайт пустой. Это так должно быть вообще?
источник

VR

Vadim Rutkovsky in OpenShift - русскоязычное сообщество
dmi3 mis
Ребят здравствуйте! Захожу тут на сайт https://operatorhub.io/ и вижу чистый лист. Сайт пустой. Это так должно быть вообще?
у меня работает. РКН может шаоит опять?
источник

dm

dmi3 mis in OpenShift - русскоязычное сообщество
хм. с двух разных сетей пробую и не робит. через Firefox на линуксе RHEL8 и Chrome на виндах. не работает.
источник

dm

dmi3 mis in OpenShift - русскоязычное сообщество
хм. в коде страницы нашел ссылку на https://operatorhub.io/static/app~748942c6.178de5.bundle.js так заработало
источник