Я юзал заббикс и ском. Ском чудовищно монструозен и не годится, если не втащить всю линейку system center. Zabbix мне не понравился тем, что там можно только очень прямолинейные метрики делать. Например хрен сделаешь проверку наличия бэкапа бд хотя бы на одной реплике. Про кластера он вообще ничего не понимает и хрен объяснишь ему, что служба либо на этом хосте, либо на другом и это нормально. Короче, в итоге навасянили свою систему на том же sql server со сбором данных запросами. Получилась полноценная аналитическая платформа, знающая когда где и что произошло во всех деталях. Но это стоило пяти лет труда.