Size: a a a

2021 December 05

r

riv1329 in ru_proxmox
Нифига не логично. Нет iops стой жди. Почему без pbs ничего не рушилось?
источник

DM

Dmitry Malinin in ru_proxmox
Стой жду - это  IOWAIT. Задача ядру. А у него и из юзерспейса своих прилетает по прежнему.
источник

r

riv1329 in ru_proxmox
Iowait не может положить ничего, если руками не трогать (не перезагружать, не убивать)
источник

r

riv1329 in ru_proxmox
Процесс на паузу будет поставлен ядром, который накидывает из юзерспейса
источник

DM

Dmitry Malinin in ru_proxmox
Как наивно. Он может притормозить базу до такого уровня, что буфра кончатся и не зафлушатся и часть данных пойдет попизде.

Конечно это тяжелый запущенный случай, после которого админа надо выгонять в 1С-ники
источник

DM

Dmitry Malinin in ru_proxmox
Это я так. Теоретически. Сам до такого не доводил неразу. Сложно сказать. Но все равно мне тревожно от такого.
источник

r

riv1329 in ru_proxmox
Не может такого быть. Можно поставить эксперемент. Поставить на паузу io у виртуалки хоть на час, и внутри все "замерзнет". Потом io разрешить и все снова заработает

Единственное что может произойти, клиенты по таймауту поотваливпются. Но с данными ничего не случится
источник

DM

Dmitry Malinin in ru_proxmox
Вероятно. Но это предположения.
источник

r

riv1329 in ru_proxmox
Проблема в pbs возникала (я надеюсь пофиксили) из-за qemu это он отдает в вм io-error на write. А отдает он видимо по тому, что некуда писать, т.к. он держит в каком-то буфере данные которые должен отдать в pbs. Он должен был бы как ядро в случае с переполнением очереди записи поставить на паузу всю vm, но вместо этого прилетала ошибка.

Кстати, тоже самое с такими же последствиями qemu сделает если создать снепшот на почти заполненном пуле zfs и место кончится. Будет write io-error. И защитьтся от этого можно только флагом werror=stop в конфигурации vm.

scsi0: myzfs:vm-103-disk-1,size=17G,werror=stop

В этом случае при переполнении пула (или файловой системы, как я думаю) машина стопнется и не попадет в не косистентное состояние. После освобожления места, её можно перезагрузить.

Но в случае с бекпом в pbs этот флаг у меня не сработал! И файловые системы в некоторых вм порушились. Хорошо, что zfs-бекап я не отключал и удачно откатил.

Всеравно было не приятно.
источник

DM

Dmitry Malinin in ru_proxmox
PBS вчера кажется обновлялся как раз
источник

r

riv1329 in ru_proxmox
Про ошибки записи, это было больше года назад, когда я пробовал pbs.

Теперь тестировать буду осторожнее.
источник

K

Kirill in ru_proxmox
Это не то о чём вы пишете? У меня похожее без zfs https://bugzilla.proxmox.com/show_bug.cgi?id=1453#c25
источник

DM

Dmitry Malinin in ru_proxmox
Возможно. Вы учитывайте, что прокс использует сильно кастомное ядро затюненное под свои низменные нужды. Где гарантия что в нем не пролюбили в угоду потребностям гипера какой то базовый функционал с вводом/выводом.

Даже простая магия тюнинга дескрипторов и буферов дает заметный эффект. Как натюнено внутри знают только разрабы прокса.
источник

I

Ivan in ru_proxmox
у меня такая же пепяка случалась на lvm поверх адаптековского массива.
источник

K

Kirill in ru_proxmox
Типа на сетапе с маленькими возможностями по iops?
источник

I

Ivan in ru_proxmox
с довольно большими возможностями. 36 блинов, кэш контроллера с батарейкой.
источник

DM

Dmitry Malinin in ru_proxmox
Дефолтовая установка прокса. Вам это о чем нибудь говорит ?
источник

DM

Dmitry Malinin in ru_proxmox
И остальное такое же. :)
источник

K

Kirill in ru_proxmox
О блин... Я надеялся что сча ssd поставлю и всё разрешится
источник

I

Ivan in ru_proxmox
там не всё так просто. для разных потомков он разный
источник