Size: a a a

KVM (PVE/oVirt etc)

2020 January 24

NS

Nik Sh in KVM (PVE/oVirt etc)
Потому что для критичного ресурса на все операции лучше ставить on-fail=fence. Иначе возможна ситуация описанная выше.
источник

k

kiosaku in KVM (PVE/oVirt etc)
т.е. отстрелит обе ноды. и останется один арбитр ...
источник

KA

Konstantin Aristov in KVM (PVE/oVirt etc)
А "ресурсы кластера - враскоряку" - это кстати как? Обе ноды на DRBD пишут? Тут действительно лучше взаимное убийство нод, чем такое ))
источник

NS

Nik Sh in KVM (PVE/oVirt etc)
kiosaku
т.е. отстрелит обе ноды. и останется один арбитр ...
а зачем тебе нода со сфейлившимся критичным ресуром? Да и можно настроить так, что к моменту пристрелки второй первая может успеть ребутнуться :)
источник

k

kiosaku in KVM (PVE/oVirt etc)
я к чему писал ... что не всегда отрабатывает корректно. и ha не так надо обеспечивать :)
источник

NS

Nik Sh in KVM (PVE/oVirt etc)
kiosaku
я к чему писал ... что не всегда отрабатывает корректно. и ha не так надо обеспечивать :)
ну я вам и ответил, что ha без фенсинга - это не ha.
источник

k

kiosaku in KVM (PVE/oVirt etc)
Nik Sh
ну я вам и ответил, что ha без фенсинга - это не ha.
перезагрузить узел, не выяснив причин - глупо. так дойдёт до того, что кластер только и будет заниматься самоотстрелом и выборами
источник

VR

Vladimir Renskiy in KVM (PVE/oVirt etc)
kiosaku
перезагрузить узел, не выяснив причин - глупо. так дойдёт до того, что кластер только и будет заниматься самоотстрелом и выборами
У вас должны быть собраны логи и метрики. И после починки кластера надо разобраться и написать постмортем
источник

VR

Vladimir Renskiy in KVM (PVE/oVirt etc)
И естественно захендлить эту ситуацию в будущем.
источник

k

kiosaku in KVM (PVE/oVirt etc)
я про то, что узел должен быть выведен из рабочего пула. и всё.
источник

VR

Vladimir Renskiy in KVM (PVE/oVirt etc)
если у вас есть ещё один запасной для квлрума и кластер выдержит нагрузку да
источник

VR

Vladimir Renskiy in KVM (PVE/oVirt etc)
В противном случае вначале самолечение кластера. Потом уже разбор и ручками лезть
источник

DN

Dmitry Nagovitsin in KVM (PVE/oVirt etc)
kiosaku
перезагрузить узел, не выяснив причин - глупо. так дойдёт до того, что кластер только и будет заниматься самоотстрелом и выборами
Что мешает искать причину после перезагрузки?
источник

A

Andrey in KVM (PVE/oVirt etc)
Dmitry Nagovitsin
Что мешает искать причину после перезагрузки?
+
источник

k

kiosaku in KVM (PVE/oVirt etc)
причину я знаю. а вот почему корректно pm-ные скрипты не отработали - нет
источник

DN

Dmitry Nagovitsin in KVM (PVE/oVirt etc)
Если идёт риск и нарушении консистентности - надо делать stonith без разговоров
источник

k

kiosaku in KVM (PVE/oVirt etc)
в данном конкретном случае
источник

k

kiosaku in KVM (PVE/oVirt etc)
и перезагрузка узла, с которого переехали ничего бы не дала
источник

k

kiosaku in KVM (PVE/oVirt etc)
полный рестарт всего кластера ... ну, если у кого-то такая политика - вперёд
источник

M

Murmuring in KVM (PVE/oVirt etc)
В ovs bond обязательно количество каналов кратно двум ?
источник