NC
Кластер овирт из 4х нод+гластер в качестве хранилища. Один из хостов в кластере oVirt после отключения/включения на нем сетевого интерфейса отвечающего за gluster перешёл в статус "NonOperational".
По логам видно что не стартует служба "oVirt Hosted Engine High Availability Monitoring Agent".
oVirt Hosted Engine High Availability Monitoring Agent "ругается" что не может датастор найти, но этот датастор смонтирован и работает.
MainThread::INFO::2020-06-22 11:12:45,825::storage_server::356::ovirt_hosted_engine_ha.lib.storage_server.StorageServer::(connect_storage_server) Connecting storage server927801cc-f7fc-40bb-9bb9-92b2b19a5087-это UUID датастора который использует hosted engine
MainThread::INFO::2020-06-22 11:12:45,841::storage_server::413::ovirt_hosted_engine_ha.lib.storage_server.StorageServer::(connect_storage_server) Refreshing the storage domain
MainThread::WARNING::2020-06-22 11:12:46,122::storage_broker::97::ovirt_hosted_engine_ha.broker.storage_broker.StorageBroker::(__init__) Can't connect vdsm storage: Command StorageDomain.getInfo with args {'storagedomainID': '927801cc-f7fc-40bb-9bb9-92b2b19a5087'} failed:
(code=350, message=Error in storage domain action: (u'sdUUID=927801cc-f7fc-40bb-9bb9-92b2b19a5087',))
Нашел что на проблемной ноде в папке
/var/run/vdsm/
нет папки storage
, которая есть на других нодах. Пробовал скопировать эту папку с живой ноды на проблемную, но не помогло.
Как можно пофиксить эту ошибку?
OS Version:Пробовал удалить ноду из кластера и заново добавить, но не дает "
RHEL - 7 - 7.1908.0.el7.centos
OS Description:
CentOS Linux 7 (Core)
Kernel Version:
3.10.0 - 1127.8.2.el7.x86_64
KVM Version:
2.12.0 - 44.1.el7_8.1
LIBVIRT Version:
libvirt-4.5.0-33.el7_8.1
VDSM Version:
vdsm-4.30.46-1.el7
SPICE Version:
0.14.0 - 9.el7
GlusterFS Version:
glusterfs-7.5-1.el7
CEPH Version:
librbd1-10.2.5-4.el7
Open vSwitch Version:
openvswitch-2.11.0-4.el7
Kernel Features:
PTI: 1, IBRS: 0, RETP: 1, SSBD: 3
Cannot remove Host. Server having Gluster volume.
"Пробовал "reinstall" из интерфейса ноды c "UNDEPLOY/DEPLOY" hosted engin-a, но тоже не помогло.