На эту тему у OVH есть забавный механизм обнаружения аппаратных неисправностей арендованного оборудования
По умолчанию, все дедики подключены к "мониторингу".
На основной IP приобретённой железки, OVH шлёт ICMP-пинги с
213.186.33.0/24Если пинг прерывается и не отвечает, он помечается в стойке, как неисправный:
http://travaux.ovh.net/vms/index_rbx.html (это лишь один из ДЦ, справа сверху выкидушка)
и спустя ещё 5-10 минут мониторинг вызывает технарей, если пинг не вернулся за это время сам
Инженеры отправляют железку в холодный ребут сначала удалённо, а если не получается, то кнопкой.
Смотрят, вернулся ли пинг.
Если пинг не возвращается, они интервенятся в аккаунт сервака (это останется в журнале в вебке), смотрят состояние по вебке и загружают сервер через образ селф-диагностики, которая там у них автоматом генерит smart-чеки, цпу чек, ram чек (этой же штукой они автоматически проверяют состояние серверов перед сдачей следующему арендатору).
Если они увидят аппаратный фейл, они сразу меняют неисправную железку (у OVH они обычно есть сразу; у SYS тоже часто есть, но может не быть конкретной) и запускают сервер ещё раз.