Nikolay Kulikov
А вторая любая история, про два чистых луча на стойку. Каждый на своём ups. И все было ок, пока один из хостов не выключили, что-то там с ним сделали, а потом включили. тут пошёл пусковой ток и выяснилось, что один из ups был на грани уже по мощности, поэтому он ушёл в перегруз, все ломанулось на второй ups (такой же), который отправился вслед за первым. Потом аккуратно включали сервера в стойке по одному и искали деньги на новые упсы..
У коллег была отличная практика по мониторингу PDU, перенесенная с мониторинга серверов - при загрузке свыше 80% алёрть. PDU у них были нагружены всего ничего - на 60% по обоим лучам, все спали блаженно. Но в один прекрасный момент потребовалось обслужить UPS, вот они один луч и обесточили автоматом. Загрузка PDU стала немного больше 100%, и по неизвестной причине ЦОД решил полностью обесточиться.