Вот за что-то легкое тут не скажу. Я трогал Prometheus, Zabbix, Nagios, PRTG.. NetData, вроде, может отдельным хостом вытупать. По мне Zabbix быстро и функцинально. Prometheus очень функционально, но совсем не быстро.
Если не надо втыкать на графики, то
https://mmonit.com/monit/ нормально можно научить реагировать на проблемы.