Телеграмм чат группы monitoring страница 214

Коллеги, добрый день.

Начал настраивать Prometheus + Grafana + Alertmanager для замены Zabbix + Grafana. И почти сразу возникло много вопросов:
1) В Prometheus нет возможности автоматически добавлять серверы в Targets?
2) То, что я вижу в :9182/metrics для машин с windows, это все доступные метрики? Как можно мониторить то, чего там нет? Например через zabbix я мог запускать скрипт на машине с Exchange, который возвращал количество писем в очереди и по этим данным строился график в Grafana. Прометей так может или нужно что-то дополнительное ставить? Мне советовали мониторить очередь через ELK, но не знаю лучший ли это вариант.
3) Нужен ли Telegraf, чтобы логи не терять в случае недоступности Прометея? Или он нужен только чтобы слать данные в InfluxDB?
4) Я нашёл одну готовую дашборду как раз по Exchange - https://grafana.com/grafana/dashboards/4755, на скриншоте увидел часть вещей, которые хотел бы использовать. Но так как у меня нет InfluxDB, я его не могу использовать. Насколько вообще необходимо ставить InfluxDB? Смена базы расширяет функционал или как?

Извините если вопросы глупые, очень большой объем информации, сложно разобраться. Буду признателен если ещё посоветуете материалы по этой теме.

Grafana Labs

Exchange Copy dashboard for Grafana | Grafana Labs

Data visualization & monitoring with support for Graphite, InfluxDB, Prometheus, Elasticsearch and many more databases

источник

21:34пожаловаться #5

DT

Dmitry Tigrov in Мониторинг

Дмитрий Стародубцев

Коллеги, добрый день.

Начал настраивать Prometheus + Grafana + Alertmanager для замены Zabbix + Grafana. И почти сразу возникло много вопросов:
1) В Prometheus нет возможности автоматически добавлять серверы в Targets?
2) То, что я вижу в :9182/metrics для машин с windows, это все доступные метрики? Как можно мониторить то, чего там нет? Например через zabbix я мог запускать скрипт на машине с Exchange, который возвращал количество писем в очереди и по этим данным строился график в Grafana. Прометей так может или нужно что-то дополнительное ставить? Мне советовали мониторить очередь через ELK, но не знаю лучший ли это вариант.
3) Нужен ли Telegraf, чтобы логи не терять в случае недоступности Прометея? Или он нужен только чтобы слать данные в InfluxDB?
4) Я нашёл одну готовую дашборду как раз по Exchange - https://grafana.com/grafana/dashboards/4755, на скриншоте увидел часть вещей, которые хотел бы использовать. Но так как у меня нет InfluxDB, я его не могу использовать. Насколько вообще необходимо ставить InfluxDB? Смена базы расширяет функционал или как?

Извините если вопросы глупые, очень большой объем информации, сложно разобраться. Буду признателен если ещё посоветуете материалы по этой теме.

Grafana Labs

Exchange Copy dashboard for Grafana | Grafana Labs

Data visualization & monitoring with support for Graphite, InfluxDB, Prometheus, Elasticsearch and many more databases

а что побудило к такой замене? модные тренды?

источник

23:40пожаловаться #6

2020 May 01

ДС

Дмитрий Стародубцев... in Мониторинг

Dmitry Tigrov

а что побудило к такой замене? модные тренды?

Zabbix старый (именно версия, которая сейчас у нас) + есть время и возможности понастраивать то, что стильно, модно, молодежно

источник

07:34пожаловаться #7

AN

Alexander Nesterov in Мониторинг

Дмитрий Стародубцев

Zabbix старый (именно версия, которая сейчас у нас) + есть время и возможности понастраивать то, что стильно, модно, молодежно

Имхо.. если у вас куб то Прометей, иначе это бред

источник

09:26пожаловаться #8

ДС

Дмитрий Стародубцев... in Мониторинг

Alexander Nesterov

Имхо.. если у вас куб то Прометей, иначе это бред

Почему? Вроде на него переходят вообще все сейчас.

источник

17:56пожаловаться #9

IA

Ilya Ableev in Мониторинг

Дмитрий Стародубцев

Почему? Вроде на него переходят вообще все сейчас.

Спорное заявление.
Есть распределение?
Посчитали, сколько людей внедряет тот же Zabbix сейчас и 5 лет назад?

источник

17:57пожаловаться #10

AN

Alexander Nesterov in Мониторинг

Дмитрий Стародубцев

Почему? Вроде на него переходят вообще все сейчас.

Инстинкт толпы, лично по мне Zabbix более продвинут как мониторинг (если умеешь его готовить)

источник

18:44пожаловаться #11

OK

Oleg Kostikov in Мониторинг

Если пытаться делать мониторинг кубера на Zabbix - там все будет построено на автообнаружениях. А у LLD rules Zabbix есть ограничения, не позволяющие приблизиться к той гибкости, с которой Prometheus оперирует лейблами.

источник

18:57пожаловаться #12

2020 May 02

ДС

Дмитрий Стародубцев... in Мониторинг

Пока есть ощущение что все равно надо попробовать настроить у себя и тогда можно будет сравнить что лучше подходит. Не знаю. Вот у prometheus вроде более удобная система алертов и можно прогнозировать возможные проблемы на основе имеющихся данных за последние n-дней

источник

21:17пожаловаться #13

2020 May 04

₭

₭Ѧℜ爪ศ in Мониторинг

Добрый день!
Мучаю logstash, нужно чтобы timestamp брался из логов которые прилетают в logstash.
Пробовал вот так:

filter {
  date {
    match => [ "message", "MMM dd HH:mm:ss", "MMM  d HH:mm:ss" ]
  }
}

Сама строка в логах выглядит как

Apr 10 18:37:54 alala %OLT: Interface EPON0/10:31's CTC OAM extension negotiated successfully!

источник

15:26пожаловаться #14

af

ari force in Мониторинг

не уверен в двух моментах.
первое - возможно надо дату вынести в отдельное поле и потом уже ловить date{}
второе - надо бы наверное указать еще target => “@timestamp” чтобы логстеш понимал чего ж ему с обретенными знаниями делать

источник

19:52пожаловаться #15

Sᕙ

Shadrach ᕙ(⇀‸↼‶)ᕗ... in Мониторинг

источник

20:01пожаловаться #16

AM

Alex Mikhaylov in Мониторинг

₭Ѧℜ爪ศ

Добрый день!
Мучаю logstash, нужно чтобы timestamp брался из логов которые прилетают в logstash.
Пробовал вот так:

filter {
  date {
    match => [ "message", "MMM dd HH:mm:ss", "MMM  d HH:mm:ss" ]
  }
}

Сама строка в логах выглядит как

Apr 10 18:37:54 alala %OLT: Interface EPON0/10:31's CTC OAM extension negotiated successfully!

Работать не будет, смотрите на grok

источник

20:44пожаловаться #17

₭

₭Ѧℜ爪ศ in Мониторинг

filter {
  grok {
    match => [ "message", "%{SYSLOGTIMESTAMP:timestamp} %{HOSTNAME} %{GREEDYDATA:new_message}" ]
  }

источник

20:45пожаловаться #18

₭

₭Ѧℜ爪ศ in Мониторинг

Alex Mikhaylov

Работать не будет, смотрите на grok

Подправил немного, и для date использую timestamp исходя из grok

источник

20:46пожаловаться #19

AM

Alex Mikhaylov in Мониторинг

Вот пример из моей практики

источник

20:46пожаловаться #20