Size: a a a

2020 September 08

CD

Constantine Drozdov in rust_offtopic
Emmanuel Goldstein
Да, но можно орать по всем каналам в случае любых необычных ситуаций
сколько есть каналов орать?
источник

EG

Emmanuel Goldstein in rust_offtopic
Constantine Drozdov
сколько есть каналов орать?
Довольно много
Плюс есть мониторинги на мониторинги
источник

EG

Emmanuel Goldstein in rust_offtopic
Если сломается мониторинг, то ДРУГОЙ мониторинг зажжётся
источник

CD

Constantine Drozdov in rust_offtopic
Emmanuel Goldstein
Довольно много
Плюс есть мониторинги на мониторинги
ладно, тогда ИБП одного из серверов будет с неисправной батареей и её вытащат
источник

EG

Emmanuel Goldstein in rust_offtopic
Это неважно, есть второй сервер на подхвате, и ещё есть сервера вообще в другом месте, которые пингуют те два на всякий случай
источник

CD

Constantine Drozdov in rust_offtopic
а потом начнут заменять не ту батарею
источник

EG

Emmanuel Goldstein in rust_offtopic
Так можно вырубить мониторинг, но нереально сделать это незаметно
источник

CD

Constantine Drozdov in rust_offtopic
а, задача ставится так
источник

CD

Constantine Drozdov in rust_offtopic
тогда отказывать сложнее
источник

CD

Constantine Drozdov in rust_offtopic
скорее всего, отказ будет по причине "слишком частые ложные срабатывания"
источник

CD

Constantine Drozdov in rust_offtopic
в итоге персонал перестанет воспринимать срабатывание предупреждения как сигнал необычной ситуации
источник

EG

Emmanuel Goldstein in rust_offtopic
Есть системы, которые давят ложные срабатывания разными способами, и ещё есть выделенные дежурные, которые смотрят на срабатывания
А отказ всей системы мониторинга это крайне редкое событие
Я помню пару раз такие глобальные факапы
источник

CD

Constantine Drozdov in rust_offtopic
Emmanuel Goldstein
Есть системы, которые давят ложные срабатывания разными способами, и ещё есть выделенные дежурные, которые смотрят на срабатывания
А отказ всей системы мониторинга это крайне редкое событие
Я помню пару раз такие глобальные факапы
насколько часто дежурные принимают решение в сторону "это не важно"?
источник

EG

Emmanuel Goldstein in rust_offtopic
Это не так просто сделать, тебе всё равно нужно описать почему это не важно в тикете, который потом будут смотреть
источник

CD

Constantine Drozdov in rust_offtopic
Emmanuel Goldstein
Это не так просто сделать, тебе всё равно нужно описать почему это не важно в тикете, который потом будут смотреть
а вот что тебе телегу писать это не важно
источник

CD

Constantine Drozdov in rust_offtopic
это стандартный отказ систем безопасности типа предупреждение о пожаре
источник

CD

Constantine Drozdov in rust_offtopic
скажем, срабатывают на курящего человека
источник

EG

Emmanuel Goldstein in rust_offtopic
Это заставляет задуматься, правда ли это не важно.
Кроме того, это низкоуровневый мониторинг — там всякие «простые» события вроде перегрева или отказа конкретных элементов системы.
источник

CD

Constantine Drozdov in rust_offtopic
Emmanuel Goldstein
Это заставляет задуматься, правда ли это не важно.
Кроме того, это низкоуровневый мониторинг — там всякие «простые» события вроде перегрева или отказа конкретных элементов системы.
Дело в другом, дело в накопленном опыте
источник

CD

Constantine Drozdov in rust_offtopic
Если ты раз в месяц видишь ложное срабатывание пожарки от курильщика - в очередной раз ты не поднимешь шухер
источник