Size: a a a

Мониторинг

2020 April 27

KC

Konstantin Che in Мониторинг
благодарю
источник

DT

Dmitry Tigrov in Мониторинг
источник

KC

Konstantin Che in Мониторинг
огроменное спасибо.
источник

KC

Konstantin Che in Мониторинг
будем изучать
источник
2020 April 30

ДС

Дмитрий Стародубцев... in Мониторинг
Коллеги, добрый день.

Начал настраивать Prometheus + Grafana + Alertmanager для замены Zabbix + Grafana. И почти сразу возникло много вопросов:
1) В Prometheus нет возможности автоматически добавлять серверы в Targets?
2) То, что я вижу в :9182/metrics для машин с windows, это все доступные метрики? Как можно мониторить то, чего там нет? Например через zabbix я мог запускать скрипт на машине с Exchange, который возвращал количество писем в очереди и по этим данным строился график в Grafana. Прометей так может или нужно что-то дополнительное ставить? Мне советовали мониторить очередь через ELK, но не знаю лучший ли это вариант.
3) Нужен ли Telegraf, чтобы логи не терять в случае недоступности Прометея? Или он нужен только чтобы слать данные в InfluxDB?  
4) Я нашёл одну готовую дашборду как раз по Exchange - https://grafana.com/grafana/dashboards/4755, на скриншоте увидел часть вещей, которые хотел бы использовать. Но так как у меня нет InfluxDB, я его не могу использовать. Насколько вообще необходимо ставить InfluxDB? Смена базы расширяет функционал или как?

Извините если вопросы глупые, очень большой объем информации, сложно разобраться. Буду признателен если ещё посоветуете материалы по этой теме.
источник

DT

Dmitry Tigrov in Мониторинг
Дмитрий Стародубцев
Коллеги, добрый день.

Начал настраивать Prometheus + Grafana + Alertmanager для замены Zabbix + Grafana. И почти сразу возникло много вопросов:
1) В Prometheus нет возможности автоматически добавлять серверы в Targets?
2) То, что я вижу в :9182/metrics для машин с windows, это все доступные метрики? Как можно мониторить то, чего там нет? Например через zabbix я мог запускать скрипт на машине с Exchange, который возвращал количество писем в очереди и по этим данным строился график в Grafana. Прометей так может или нужно что-то дополнительное ставить? Мне советовали мониторить очередь через ELK, но не знаю лучший ли это вариант.
3) Нужен ли Telegraf, чтобы логи не терять в случае недоступности Прометея? Или он нужен только чтобы слать данные в InfluxDB?  
4) Я нашёл одну готовую дашборду как раз по Exchange - https://grafana.com/grafana/dashboards/4755, на скриншоте увидел часть вещей, которые хотел бы использовать. Но так как у меня нет InfluxDB, я его не могу использовать. Насколько вообще необходимо ставить InfluxDB? Смена базы расширяет функционал или как?

Извините если вопросы глупые, очень большой объем информации, сложно разобраться. Буду признателен если ещё посоветуете материалы по этой теме.
а что побудило к такой замене? модные тренды?
источник
2020 May 01

ДС

Дмитрий Стародубцев... in Мониторинг
Dmitry Tigrov
а что побудило к такой замене? модные тренды?
Zabbix старый (именно версия, которая сейчас у нас) + есть время и возможности понастраивать то, что стильно, модно, молодежно
источник

AN

Alexander Nesterov in Мониторинг
Дмитрий Стародубцев
Zabbix старый (именно версия, которая сейчас у нас) + есть время и возможности понастраивать то, что стильно, модно, молодежно
Имхо.. если у вас куб то Прометей, иначе это бред
источник

ДС

Дмитрий Стародубцев... in Мониторинг
Alexander Nesterov
Имхо.. если у вас куб то Прометей, иначе это бред
Почему? Вроде на него переходят вообще все сейчас.
источник

IA

Ilya Ableev in Мониторинг
Дмитрий Стародубцев
Почему? Вроде на него переходят вообще все сейчас.
Спорное заявление.
Есть распределение?
Посчитали, сколько людей внедряет тот же Zabbix сейчас и 5 лет назад?
источник

AN

Alexander Nesterov in Мониторинг
Дмитрий Стародубцев
Почему? Вроде на него переходят вообще все сейчас.
Инстинкт толпы, лично по мне Zabbix более продвинут как мониторинг (если умеешь его готовить)
источник

OK

Oleg Kostikov in Мониторинг
Если пытаться делать мониторинг кубера на Zabbix - там все будет построено на автообнаружениях. А у LLD rules Zabbix есть ограничения, не позволяющие приблизиться к той гибкости, с которой Prometheus оперирует лейблами.
источник
2020 May 02

ДС

Дмитрий Стародубцев... in Мониторинг
Пока есть ощущение что все равно надо попробовать настроить у себя и тогда можно будет сравнить что лучше подходит. Не знаю. Вот у prometheus вроде более удобная система алертов и можно прогнозировать возможные проблемы на основе имеющихся данных за последние n-дней
источник
2020 May 04

₭Ѧℜ爪ศ in Мониторинг
Добрый день!
Мучаю logstash, нужно чтобы timestamp брался из логов которые прилетают в logstash.
Пробовал вот так:
filter {
 date {
   match => [ "message", "MMM dd HH:mm:ss", "MMM  d HH:mm:ss" ]
 }
}
Сама строка в логах выглядит как
Apr 10 18:37:54 alala %OLT: Interface EPON0/10:31's CTC OAM extension negotiated successfully!
источник

af

ari force in Мониторинг
не уверен в двух моментах.
первое - возможно надо дату вынести в отдельное поле и потом уже ловить date{}
второе - надо бы наверное указать еще target => “@timestamp” чтобы логстеш понимал чего ж ему с обретенными знаниями делать
источник

Sᕙ

Shadrach ᕙ(⇀‸↼‶)ᕗ... in Мониторинг
источник

AM

Alex Mikhaylov in Мониторинг
₭Ѧℜ爪ศ
Добрый день!
Мучаю logstash, нужно чтобы timestamp брался из логов которые прилетают в logstash.
Пробовал вот так:
filter {
 date {
   match => [ "message", "MMM dd HH:mm:ss", "MMM  d HH:mm:ss" ]
 }
}
Сама строка в логах выглядит как
Apr 10 18:37:54 alala %OLT: Interface EPON0/10:31's CTC OAM extension negotiated successfully!
Работать не будет,  смотрите на grok
источник

₭Ѧℜ爪ศ in Мониторинг
filter {
 grok {
   match => [ "message", "%{SYSLOGTIMESTAMP:timestamp} %{HOSTNAME} %{GREEDYDATA:new_message}" ]
 }
источник

₭Ѧℜ爪ศ in Мониторинг
Alex Mikhaylov
Работать не будет,  смотрите на grok
Подправил немного, и для date использую timestamp исходя из grok
источник

AM

Alex Mikhaylov in Мониторинг
Вот пример из моей практики
источник