Size: a a a

Мониторинг

2019 March 05

DT

Dmitry Tigrov in Мониторинг
а кто вобще говорил что подгорает? ну есть фича но из за того что она не готова к публичному использованию ее не документируют хотя и не запрещают этим пользоватся
источник

DT

Dmitry Tigrov in Мониторинг
Andrey Konovalov
Сейчас я уже отчаялся просто и решил запустить через ssh эту несчастную команду.
С заббикс-агентом всё плохо, потому что у нас есть общая политика для агентов - запрет Remote Commands, он продиктован безопасниками и PCI DSS
кстати а каким пунктом pci compliance запрещены remote commands?
источник

AK

Andrey Konovalov in Мониторинг
Dmitry Tigrov
кстати а каким пунктом pci compliance запрещены remote commands?
Я ж его не провожу. У нас есть внутренняя служба аудита, готовящая компанию к ежегодному PCI DSS-"освидетельствованию" (сертификации?), вот от них мне и прилетело:
ОНИ: remote command'ы есть?
Я: Нннет... (ещё по работе с ДИТ Москвы помню, как они такие вещи не любят)
ОНИ: А если найдём?!
Я: Ну, ищите-ищите (посмеиваясь про себя, поскольку сознательно нигде не включал их)
источник

DT

Dmitry Tigrov in Мониторинг
просто у нас вакханалия безопасников доходит то того что запрещают бастион хосты на linux из за невозможности отключения буфера обмена 🙂 типо ктото сказал что это не pci compliant но спорить с этим никто не хочет
источник

DT

Dmitry Tigrov in Мониторинг
хотя я весь документ прочитал и ниодного пункта про это не нашел
источник

AK

Andrey Konovalov in Мониторинг
Dmitry Tigrov
просто у нас вакханалия безопасников доходит то того что запрещают бастион хосты на linux из за невозможности отключения буфера обмена 🙂 типо ктото сказал что это не pci compliant но спорить с этим никто не хочет
Аналогично. У нас процентов 50 времени на этапе реализации новых проектов уходит тупо на какое-то беконечное согласование с безопасниками и "уговоры" согласовать дырки в бессчётных фаерволлах.
источник
2019 March 06

AE

Ant0n Erem1n in Мониторинг
Хорошая статья о том когда и зачем использовать хитмапы в мониторинге. https://www.honeycomb.io/blog/heatmaps-make-ops-better/
источник
2019 March 07

C

Crash in Мониторинг
Друзья приветствую.  Подскажите на скрине внизу два триггера. Триггер на снмп опрос  "Потеря фазы или полное погашение"  а триггер "Потеря фазы или полное погашение" on (hostname) это снмп трап.
Возник вопрос у меня снмп опрос опрашивается раз в 5 минут и бывает так что снмп трап о восстановлении не приходит и получается что снмп опрос уже в true А снмп  трап висит пока вручную его не закроешь. Как его привязать если снмп опрос true Значит снмп трап закрыть триггер?
источник

TF

Terry Filch in Мониторинг
Crash
Друзья приветствую.  Подскажите на скрине внизу два триггера. Триггер на снмп опрос  "Потеря фазы или полное погашение"  а триггер "Потеря фазы или полное погашение" on (hostname) это снмп трап.
Возник вопрос у меня снмп опрос опрашивается раз в 5 минут и бывает так что снмп трап о восстановлении не приходит и получается что снмп опрос уже в true А снмп  трап висит пока вручную его не закроешь. Как его привязать если снмп опрос true Значит снмп трап закрыть триггер?
тебе сюда https://t.me/ZabbixPro
источник

C

Crash in Мониторинг
Спасибо
источник
2019 March 09

AE

Ant0n Erem1n in Мониторинг
Martin Schneppenheim представил Kube Eagle — prometheus exporter для Kubernetes, который помогает существенно улучшить визуализацию утилизации кластеров.

Статья с описанием: http://amp.gs/4tVU
GitHub: http://amp.gs/4tVO
источник
2019 March 10

AE

Ant0n Erem1n in Мониторинг
Пилил я тут недавно дашбоард по нашим тикетам. Сколько времени тратим, сколько тикетов каждого типа к нам приходит, какие severity у инцидентов. И была там одна метрика, которая нам очень важна, но подсчитать ее в лоб не так-то просто. Это - время ответа на заявку и время закрытия заявки.

С одной стороны ничего сложного - вычитаем из поля responded_timestamp значение поля created_at и получаем время ответа. Или среднее или персентили - все что душе угодно. Но блин, ведь заявка, созданная вечером, в нерабочее время будет обработана только с утра. Это как минимум часов 8. А нам надо как-то учитывать только рабочее время - исключать праздники, выходные и время с 19 до 10

Забыл упомянуть, что все данные хранились в эластике - просто грузили все тикеты и информацию о них в json'ке. А для визуализации у нас была кибана. Собственно выбор был очевиден - нужно использовать scripted fields и писать скрипт на языке painless. Быстрый гуглинг результатов не дал - никаких исходников или скриптов примерно решающих ту же задачу не нашлось.

Пришлось отдавать на аутсорс и писать собственное решение. Именно им я и хочу поделиться с вами, уважаемые коллеги. Если вдруг кто-то использует kiban'у как BI инструмент и хочет рассчитывать разницу между двумя датами с учетом рабочего времени - welcome! Скрипт вы можете найти здесь: https://gist.github.com/vozerov/c3578e727e511cd99fd7e9af3e348e14

Если у кого-то если желание его доработать или добавить функционала - пишите, опубликую ваши апдейты 🙂

P.S. В итоге все равно ушли на редаш с постгресом - не смогли добить некоторые метрики в эластике без join'ов.
источник

NK

ID:624955335 in Мониторинг
Доброго всем
источник

AE

Ant0n Erem1n in Мониторинг
Привет
источник
2019 March 11

MS

Maxim Semenov in Мониторинг
А кто-то смотрел - пользовал
https://github.com/netdata/netdata
источник

TF

Terry Filch in Мониторинг
prometheus ваш путь
источник

TF

Terry Filch in Мониторинг
вместо этого уг
источник

MS

Maxim Semenov in Мониторинг
:) прометеус - да :) хотя сейчас у нас заббис.
источник

DT

Dmitry Tigrov in Мониторинг
прометей несложно сбоку присобачить даже если основная система заббикс, раскатать нод экспортеры и подпилить скрипты для того чтобы данные еще и в файлики пихали чтобы через экспортеры в прометей уходило
источник
2019 March 14

DS

Dmitry Soloviev in Мониторинг
Всем привет. Пишу простенький облачный сервис мониторинга, если есть желание помочь с тестированием велкам в личку)
источник