Публикация о том, как лучше всего представлять метрики на дашбордах. Определенно актуально для всех, кто представляет информацию из показателей мониторинга или разработки программного обеспечения.
Создание отказоустойчивого, высокодоступного двухплечевого кластера Zabbix-сервера, работающего в режиме Active-Active и обеспечивающего непрерывность управления, записи, а также исключающего возможность дублирования информации при записи в базу данных.
в разных конторах по разному. В одной NetXMS + proxy на внешке. Сыпали алерты в один чат. В другой Кластер Zabbix + Proxy. Типа такого - https://linoxide.com/configure-zabbix-proxy-external-monitoring-centos-7/ В совсем мелких внутри был мониторинг на скриптах RouteOS а на внешке бесплатные сервисы мониторинга привязанные к внешним ip и портам организации
если инфра "настоящая" то достаточно zabbix если в виде кода, то пром или датадог внешний мониторинг от многих факторов зависит, если есть дубль цод, то ставите там узлы по мониторингу. есть узлы торчащие на внешку? мониторьте только их сторон. сервисами или своими на vds\vps есть месенджеры с алертами, но в локалке - думайте как следить получить доступ (rdp, vnc, VMware Horizon Client)
Получил от alert manager такое сообщение. Blackbox Exporter начал чудить и не находить мои адреса. Хотя они были доступны. Похоже перешел на ipv6, потому что после изменения настроек на: preferred_ip_protocol: ip4 все пришло в норму. #мониторинг