Телеграмм чат группы pro

Size: a a a

KVM (PVE/oVirt etc)

653 membersпожаловаться на группу

2020 January 24

Nik Sh in KVM (PVE/oVirt etc)

Потому что для критичного ресурса на все операции лучше ставить on-fail=fence. Иначе возможна ситуация описанная выше.

источник

08:59пожаловаться #1

kiosaku in KVM (PVE/oVirt etc)

т.е. отстрелит обе ноды. и останется один арбитр ...

источник

09:12пожаловаться #2

Konstantin Aristov in KVM (PVE/oVirt etc)

А "ресурсы кластера - враскоряку" - это кстати как? Обе ноды на DRBD пишут? Тут действительно лучше взаимное убийство нод, чем такое ))

источник

09:21пожаловаться #3

Nik Sh in KVM (PVE/oVirt etc)

kiosaku

т.е. отстрелит обе ноды. и останется один арбитр ...

а зачем тебе нода со сфейлившимся критичным ресуром? Да и можно настроить так, что к моменту пристрелки второй первая может успеть ребутнуться :)

источник

09:30пожаловаться #4

kiosaku in KVM (PVE/oVirt etc)

я к чему писал ... что не всегда отрабатывает корректно. и ha не так надо обеспечивать :)

источник

09:31пожаловаться #5

Nik Sh in KVM (PVE/oVirt etc)

kiosaku

я к чему писал ... что не всегда отрабатывает корректно. и ha не так надо обеспечивать :)

ну я вам и ответил, что ha без фенсинга - это не ha.

источник

09:43пожаловаться #6

kiosaku in KVM (PVE/oVirt etc)

Nik Sh

ну я вам и ответил, что ha без фенсинга - это не ha.

перезагрузить узел, не выяснив причин - глупо. так дойдёт до того, что кластер только и будет заниматься самоотстрелом и выборами

источник

09:47пожаловаться #7

Vladimir Renskiy in KVM (PVE/oVirt etc)

kiosaku

У вас должны быть собраны логи и метрики. И после починки кластера надо разобраться и написать постмортем

источник

09:49пожаловаться #8

Vladimir Renskiy in KVM (PVE/oVirt etc)

И естественно захендлить эту ситуацию в будущем.

источник

09:49пожаловаться #9

kiosaku in KVM (PVE/oVirt etc)

я про то, что узел должен быть выведен из рабочего пула. и всё.

источник

09:50пожаловаться #10

Vladimir Renskiy in KVM (PVE/oVirt etc)

если у вас есть ещё один запасной для квлрума и кластер выдержит нагрузку да

источник

09:51пожаловаться #11

Vladimir Renskiy in KVM (PVE/oVirt etc)

В противном случае вначале самолечение кластера. Потом уже разбор и ручками лезть

источник

09:52пожаловаться #12

Dmitry Nagovitsin in KVM (PVE/oVirt etc)

kiosaku

Что мешает искать причину после перезагрузки?

источник

10:03пожаловаться #13

Andrey in KVM (PVE/oVirt etc)

Dmitry Nagovitsin

Что мешает искать причину после перезагрузки?

источник

10:04пожаловаться #14

kiosaku in KVM (PVE/oVirt etc)

причину я знаю. а вот почему корректно pm-ные скрипты не отработали - нет

источник

10:04пожаловаться #15

Dmitry Nagovitsin in KVM (PVE/oVirt etc)

Если идёт риск и нарушении консистентности - надо делать stonith без разговоров

источник

10:04пожаловаться #16

kiosaku in KVM (PVE/oVirt etc)

в данном конкретном случае

источник

10:05пожаловаться #17

kiosaku in KVM (PVE/oVirt etc)

и перезагрузка узла, с которого переехали ничего бы не дала

источник

10:05пожаловаться #18

kiosaku in KVM (PVE/oVirt etc)

полный рестарт всего кластера ... ну, если у кого-то такая политика - вперёд

источник

10:06пожаловаться #19

Murmuring in KVM (PVE/oVirt etc)

В ovs bond обязательно количество каналов кратно двум ?

источник

10:18пожаловаться #20