Вчера писал про сервис, который можно прикрутить к zabbix и слать смски или звонить по телефону. Вспомнился случай один из практики. Я настраивал мониторинг и в какой-то момент меня попросили сделать так, чтобы по определенным триггерам он мог позвонить на телефон и что-то сказать.
В целом, настройка тут очень простая. Я делал с помощью asterisk. Если вы с ним знакомы, то большого труда не составит все реализовать. Логика там такая. Zabbix запускает скрипт по событию, который формирует call файл для asterisk. А тот эти файлы в режиме реального времени мониторит и начинает сразу звонить, когда новый появляется. Я все это описывал в своей
статье.
Так вот, триггер там был так себе, не супер критичный. Я бы на такое звонить не стал, о чем и сказал. Вообще, слать смс и звонить в любое время суток можно только по супер критичным метрикам. Например, у вас интернет магазин и он недоступен уже минут 10. Вот это достойно того, чтобы позвонить кому-то даже ночью, если у вас в это время идут продажи и бизнес встает при недоступности сайта.
А если у вас проц 30 минут загружен на 100%, но при этом все работает и нет дежурной смены, то админа не стоит из-за этого будить ночью. Утром встанет, разберется, если проблема останется. Там было событие (бизнес метрика, привязанная к базе), которое только предвещало беду, но еще не было бедой само по себе. Я все объяснил заказчику. Он сказал, что с него требуют такую настройку. Более того, тот, кто требует, хочет еще и сам такие звонки получать. Ему это нужно для какого-то контроля. Ну раз хочет, пусть получает. Я все настроил.
Через пару недель меня попросили отключить этот триггер. Он сработал 2 ночи подряд и позвонил этому начальнику. В итоге он понял, что плохая была идея и отыграл все назад. Они, кстати, больше вообще не попросили никаких оповещений в виде звонков на телефон.
❗️Надо очень аккуратно относиться к оповещениям мониторинга и настраивать только то, что действительно важно. Как только идет спам из мониторинга, на который забивают, считай, что мониторинга у вас нет. Я всегда это объясняю заказчикам и проговариваю, что хороший мониторинг это непрерывный процесс, который требует длительной калибровки. Не получится у вас один раз все настроить и с этим жить. Не видел такого ни разу. Все системы разные и триггеры с оповещениями 100% придется донастраивать в процессе.
#zabbix #мониторинг #asterisk