Телеграмм чат группы ru_openshift страница 1142

2021 January 22

СЗ

Сергей Заикин... in OpenShift - русскоязычное сообщество

в https://github.com/openshift/openshift-docs

в свежих найтли принимается кстати - https://github.com/openshift/okd-machine-os/pull/55

GitHub

openshift/openshift-docs

OpenShift 3 and 4 product and community documentation - openshift/openshift-docs

спасибо

источник

23:22пожаловаться #1

n

neb0t in OpenShift - русскоязычное сообщество

Всем привет.
Кто-то делал резервирование или высокую достпность на OCP (OpehShift 3.11/4.6) ?

Те, кто с aws/gc могут тут же слиться/сдуться - солюшин на коленках (vmware vsphere и даже не бармэтал)...
Так что реплицировать FS в 2 DC одновреммено пока не плучачается из-за лока на SMB v3, который не NFS и очень сцыкотно его сделать таковым.

Много букав и не факт что все прочтут дальше, но:
Есть 2-а DC кластера (1/2), NAS (который виндовый DFS и в 3.11/4.6 роняется при паении кластера в DC1).
Была процера DR: уронили в DC1 кластер, быстро поменяли DNS на DC2 и в течении 1-2 ч ( а может и 24ч) подняли с 0-ля (cold start) кластер в DC2 и рестором дампа с DC1 восстановили работу всех сервисов с новым DFS, что приехал с новым DNS...
Это не высокая доступность, так как даунтайм впечатляет и делает огромный стресс на почки, серце и так далее.

Вопрос, есть ли изящный солюшин для того, чтобы рестор на стороне Б был 15-30 мин максимум (hot-standby или repliica в DC2) ?
Сам придумал только semi-hot standby с использованем лейблом меток, но солюшин так себе, так как некоторые системные поды стартуют в DC2 (неактивном) и из-за этого перформенс кластера очень сильно страдает.

Буду рад любому холли вару.

источник

23:42пожаловаться #2

n

neb0t in OpenShift - русскоязычное сообщество

Добавлю - модно еще девелоперов попросить наговнить кода, чтобы app сам определял какой DFS и достпный ли pvc, но очень не хотелось бы так как время девов денег стоит 😄

источник

23:44пожаловаться #3

n

neb0t in OpenShift - русскоязычное сообщество

И да - вопрос интересный - OCP 4.7 должен из коробки поддерживать ремоунт SMB через CSI smb... А пока, ядро не умеет ... И на центосе примонтировать обратно не получиться без велосипеда

источник

23:46пожаловаться #4

2021 January 23

СЗ

Сергей Заикин... in OpenShift - русскоязычное сообщество

Держать все конфиги в гите, применять через argocd например, чтобы ускорить миграцию, централизованно применять изменения.
Smb странная штука имхо, я бы попробовал async replica на ceph.

Ну и dns балансер прикручивать чтобы автоматом фейловерил

https://docs.ceph.com/en/latest/rbd/rbd-mirroring/

источник

00:00пожаловаться #5

AG

Alex Gluck in OpenShift - русскоязычное сообщество

напиши им баг тогда

bh

billy bob harley in OpenShift - русскоязычное сообщество

neb0t

Всем привет.
Кто-то делал резервирование или высокую достпность на OCP (OpehShift 3.11/4.6) ?

Те, кто с aws/gc могут тут же слиться/сдуться - солюшин на коленках (vmware vsphere и даже не бармэтал)...
Так что реплицировать FS в 2 DC одновреммено пока не плучачается из-за лока на SMB v3, который не NFS и очень сцыкотно его сделать таковым.

Много букав и не факт что все прочтут дальше, но:
Есть 2-а DC кластера (1/2), NAS (который виндовый DFS и в 3.11/4.6 роняется при паении кластера в DC1).
Была процера DR: уронили в DC1 кластер, быстро поменяли DNS на DC2 и в течении 1-2 ч ( а может и 24ч) подняли с 0-ля (cold start) кластер в DC2 и рестором дампа с DC1 восстановили работу всех сервисов с новым DFS, что приехал с новым DNS...
Это не высокая доступность, так как даунтайм впечатляет и делает огромный стресс на почки, серце и так далее.

Вопрос, есть ли изящный солюшин для того, чтобы рестор на стороне Б был 15-30 мин максимум (hot-standby или repliica в DC2) ?
Сам придумал только semi-hot standby с использованем лейблом меток, но солюшин так себе, так как некоторые системные поды стартуют в DC2 (неактивном) и из-за этого перформенс кластера очень сильно страдает.

Буду рад любому холли вару.

Держали по кластеру в ДЦ. Деплоили сразу в 2 кластера. При переключении просто меняли днс у точки входа. Файловые шары синкали средствами операционной системы.

источник

11:55пожаловаться #7

JS

John Smith in OpenShift - русскоязычное сообщество

billy bob harley

Держали по кластеру в ДЦ. Деплоили сразу в 2 кластера. При переключении просто меняли днс у точки входа. Файловые шары синкали средствами операционной системы.

а через днс не медленно ли переключение происходило?

источник

14:08пожаловаться #8

bh

billy bob harley in OpenShift - русскоязычное сообщество

John Smith

а через днс не медленно ли переключение происходило?

Dns наши, корпоративные. Меняем внутренние днсы.

источник

16:17пожаловаться #9

JS

John Smith in OpenShift - русскоязычное сообщество

billy bob harley

Dns наши, корпоративные. Меняем внутренние днсы.

да это-то понятно.
просто всё равно ж где-то есть балансер/маршрутизатор, на который летит трафик извне, и до него-то обновления DNS записей же не сразу дойдут.

источник

16:33пожаловаться #10

bh

billy bob harley in OpenShift - русскоязычное сообщество

Ну секунда-две может,что-то и пропадает, хотя я не замечал. Но это лучше чем размазывать кластер на два дата центра.

источник

16:37пожаловаться #11

JS

John Smith in OpenShift - русскоязычное сообщество

а почему бы просто на балансере не переключать?

источник

16:38пожаловаться #12

n

neb0t in OpenShift - русскоязычное сообщество

dfs центос 7 еще не аучился автоматом перемонтировть. Сентос 8 с последним ядром - тот умеет, но оцр 4.6 имеет старую версию ядра - после смены днс на файл шару - монтируется пустой PVC ... нету ошибок кроме как в dmesg систпа репортирует что файлшара недоступна по старому ИР.
Это ограничение csi-smb драйвера... Убивать под с fstab просто нельзя, так как не подымутся тогда поды.
Окай, спасибо за пищу для размешлений @Kendepp Vic

источник

17:49пожаловаться #13

n

neb0t in OpenShift - русскоязычное сообщество

на балансере переключение не проблема - проблема с перформенсом, если деплоить сразу в 2 кластера, так как поды постоянно к базе данных обращаются и при 2 актывных дц перформанса не будет.

источник

17:50пожаловаться #14

n

neb0t in OpenShift - русскоязычное сообщество

код хранитса в гите - не проблема поднять кластер с 0, просто может есть еще какие-то подходы проверены на проде. хотя бы хай левел, так как у каждого свой софт и способ развертвывания

источник

17:53пожаловаться #15

2021 January 25

BB

Boriss Borisovich in OpenShift - русскоязычное сообщество

Roman Tsisyk

Мы metalb используем

вы просто металлб юзаете? лб сервис без ингресса?

источник

02:26пожаловаться #16

dm

dmi3 mis in OpenShift - русскоязычное сообщество