если не в лом, то конечно, с удовольствием послушаю)
Если вкратце. У заказчика был WNLB кластер для 2010-го эксча (CAS+HUB). 2 сервера на VMWARE + 2 на HYPER-V. периодически кластер разваливается, один сервер находится в нормальном состоянии,остальные в состоянии схождения. Критсит, кейс. Долго ждать никто не хочет, логи там собирать. Проблема решается ребутом узла. Со стороны поддержки проблем нет - не проблема ОС. а это мой постоянный заказчик, за которого я переживаю больше, чем за кого-то. в итоге на площадке торможу процесс перезапуска - собираю сетевой дам с узлов. и вижу, что остальные узлы пытаются сойтись - отправляя пакеты, которые сошедшийся узел не получает. Теперь думаем, на секундочку, как такую проблему решать... жесть да? Сетевой стек, прослойка гипервизора. тут мне повезло - нужен был тип адаптера vmxnet3 вместо легаси e1000 на vmware. Пришлось почитать доки по бест прастис от vmware (мне, PFE отMS 😊) рекомендацию по замене не могли сделать год (запрет на работы). и вот в январские праздники случилось. Проблема ушла. Я не люблю такие проблемы, особенно, с которыми не могу помочь. особенно, когда и смогла, но так много времени заняло