Size: a a a

Церковь метрик

2020 April 15

AK

Andrey Kartashov in Церковь метрик
Anton Smolkov
Пром не подходит.
Нужен именно пуш, так как нужно отслеживать старты/стопы очень часто выполняющихся заданий.
так вам на пуш и показывают
источник

AK

Andrey Kartashov in Церковь метрик
Anton Smolkov
Ок, досыплю информации.
Есть задания, типа k8s cronjobs, которые работают с периодичностью от 2-ух секунд до нескольких часов, в зависимости от типа.
Иногда задания одного типа запускаются параллельно, а иногда могут и не запуститься вовсе. Именно это нужно отслеживать по метрикам.
я для этого healthchecks.io использую. Кронджоба запускается, отправляет POST started, если валится отправляет POST failed, если всё ок, отправляет POST success. При этом healthchecks.io знает про расписание, и даже если ему не придёт POST started/success запишет, что таска не запускалась.

self-hosted решения подобного типа тоже есть. Дальше можно уже от них отправлять метрики в VM/prom/whatever
источник

AS

Anton Smolkov in Церковь метрик
Andrey Kartashov
я для этого healthchecks.io использую. Кронджоба запускается, отправляет POST started, если валится отправляет POST failed, если всё ок, отправляет POST success. При этом healthchecks.io знает про расписание, и даже если ему не придёт POST started/success запишет, что таска не запускалась.

self-hosted решения подобного типа тоже есть. Дальше можно уже от них отправлять метрики в VM/prom/whatever
Спасибо, интересно. Из self-hosted какие, например?
источник

AS

Anton Smolkov in Церковь метрик
А, да прям это и можно использовать он-прем, репа на гитхабе с исходниками. BSD 3-Clause "New" or "Revised" License
источник

AK

Andrey Kartashov in Церковь метрик
Anton Smolkov
Спасибо, интересно. Из self-hosted какие, например?
тут несколько дней назад обсуждали, приводили несколько вариантов https://github.com/balerter/balerter https://github.com/healthchecks/healthchecks - можно ещё поискать. Я сам не пользовался, конкретное что-от не посоветую
источник

AK

Andrey Kartashov in Церковь метрик
единственно, непонятно как вы будете параллельные одинаковые таски отслеживать. По идее, проверка на каждую таску своя должна быть
источник

AS

Aleksey Shirokikh in Церковь метрик
Aleksey Shirokikh
Online Monitoring Day - 15 апреля.
Просим вас не забыть зарегистрироваться на мероприятие (https://eventuer.timepad.ru/event/1247459/). Там будет ссылка куда направлять ваши браузеры
Программа:

10:00 - Free Talk, круглый стол со спикерами “Коронавирус, новые тренды, новые компоненты технологического стека, прогнозы”
11:00 - Илья Аблеев, представитель Zabbix Russian Community, тема доклада уточняется
11:40 - Кирилл Малеванов, технический директор, Selectel, “Мониторинг электронагрузки в серверных стойках”
12:20 - Экспертная сессия PRTG, Вячеслав Милованов, системный инженер
13:00 - Экспертная сессия Grafana Labs, Александр Зобнин, разработчик
13:40 - Завершение

Конференция будет транслироваться на YouTube канале - https://www.youtube.com/channel/UCyQ9sLBi9F3Mo_LRQrJ6RNg

Будем рады вас видеть онлайн!
кстати 15 апреля это как раз сегодня. и конфа уже лайф!
источник

SM

Stanislau Makaravets in Церковь метрик
Добрый день. Может кто подскажет, чем обусловлена архитектура Prometheus с использованием агента для каждого сервиса? Почему один агент не может экспортить множество метрик, как это делает telegraf (опуская разницу push/pull). Может кто-нибудь объяснить? Спасибо
источник

IE

Ivan EKbfh in Церковь метрик
Stanislau Makaravets
Добрый день. Может кто подскажет, чем обусловлена архитектура Prometheus с использованием агента для каждого сервиса? Почему один агент не может экспортить множество метрик, как это делает telegraf (опуская разницу push/pull). Может кто-нибудь объяснить? Спасибо
думаю, kiss
источник

IE

Ivan EKbfh in Церковь метрик
телеграф конечно комбайн и многое может, но вот гранулярно его настроить — замучаешься
источник

SM

Stanislau Makaravets in Церковь метрик
Меня интересует вопрос, почему не сделать вариант с blackbox експортер, который мог бы работать с множетвом сервисов. Т.е. Сама задумка и принцип работы Prometheus очень хороша, но пугает то, в больших масштабах мне нужны тысячи агентов. Причем на один запущенный сервис, нужно буде запустить несколько экспортеров.
источник

N

Nklya in Церковь метрик
А в чем проблема, ты ж не руками это делаешь
источник

SM

Stanislau Makaravets in Церковь метрик
Это понятно, но общая инфраструктура усложняется. Может есть какая-нибудь хорошая книга или статья, которая может пролить свет почему сделано так, а не иначе? Был бы очень благодарен за помозь в понимании данного вопроса
источник

EL

Evgeny Lazin in Церковь метрик
Stanislau Makaravets
Меня интересует вопрос, почему не сделать вариант с blackbox експортер, который мог бы работать с множетвом сервисов. Т.е. Сама задумка и принцип работы Prometheus очень хороша, но пугает то, в больших масштабах мне нужны тысячи агентов. Причем на один запущенный сервис, нужно буде запустить несколько экспортеров.
Можно использовать netdata вместе с промом. Но лучше конечно использовать netdata не с промом, а с нормальной TSDB.
источник

SM

Stanislau Makaravets in Церковь метрик
Evgeny Lazin
Можно использовать netdata вместе с промом. Но лучше конечно использовать netdata не с промом, а с нормальной TSDB.
Спасибо за наводку. Не слышал еще о таком сервисе мониторинга. Сейчас изучу.
источник

PL

Pavel Litvyak in Церковь метрик
Stanislau Makaravets
Добрый день. Может кто подскажет, чем обусловлена архитектура Prometheus с использованием агента для каждого сервиса? Почему один агент не может экспортить множество метрик, как это делает telegraf (опуская разницу push/pull). Может кто-нибудь объяснить? Спасибо
Мне кажется, что тут просто дело в том, что разработчики прометеуса не занимаются разработкой экспортеров (кроме node-exporter-a). А сообщество уже пилит отдельные экспортеры под свои нужды. При этом никто не запрещает запилить один экспортер собирающий кучу разнородных метрик, каких-то органичений нет, вроде бы.
источник

SM

Stanislau Makaravets in Церковь метрик
Да, и есть примеры, где один экспортер, может обслуживать несколько точек. Но тогда конфигурация смещается в агента. А это уже не хорошо
источник

PL

Pavel Litvyak in Церковь метрик
Stanislau Makaravets
Да, и есть примеры, где один экспортер, может обслуживать несколько точек. Но тогда конфигурация смещается в агента. А это уже не хорошо
Погоди, ты имеешь ввиду почему не сделать экспортер собирающий метрики сразу с нескольких хостов?
источник

SM

Stanislau Makaravets in Церковь метрик
не хостов, а сервисов.
источник

АП

Андрей Привалов in Церковь метрик
В моделе прометеуса - сервисы публикуют свои метрики, А один пром вполне себе ходит сразу ко всем сервисам и собирает их
источник