Как по часам распидорашивало через 60 дней аптайма ту часть шедулера процессов, которая считала энергопотребление (и она начинала спамить в дмесг десятками килобайт ошибок в секунду).
А на другой группе хостов стабильно через 90 дней связка aufs+tmpfs+nfs начинала возвращать EIO для всего, что не лежало в pagecache.
Так я перестал смеяться над мониторингом аптайма .__.