Телеграмм чат группы metrics

а можно чуть больше деталей насчет рестарта и интервала в 200мс, необходимо сделать какую либо автоматизаци на этот счет? или просто отловить? если отловить uptime счетчик и ловить counter reset

источник

15:05пожаловаться #7

AN

Artem Navoiev in Церковь метрик

если автоматизаци - то скорее всего надо писать свое ПО для этого, ну или фиксить рестарты

источник

15:06пожаловаться #8

A

Andor in Церковь метрик

Artem Navoiev

а можно чуть больше деталей насчет рестарта и интервала в 200мс, необходимо сделать какую либо автоматизаци на этот счет? или просто отловить? если отловить uptime счетчик и ловить counter reset

Зачем счётчик, если можно время запуска отдавать метрикой

источник

15:14пожаловаться #9

AN

Artem Navoiev in Церковь метрик

или так

источник

15:18пожаловаться #10

ДУ

Денис Устинов in Церковь метрик

время запуска наверное самый правильный путь

источник

15:20пожаловаться #11

GM

Gleb Mekhrenin in Церковь метрик

Aleksey Lazarev

Хотя рестарт какого нибудь нджинска как пример

а зачем его так рестартить?

источник

15:43пожаловаться #12

TF

Terry Filch in Церковь метрик

пс, там записи с PromCon 2019 выложили

YouTube

Prometheus Monitoring

Talks and other videos about the Prometheus (https://prometheus.io) monitoring system.

источник

17:29пожаловаться #13

W

Womchik in Церковь метрик

И звук не пропадает?

источник

17:37пожаловаться #14

a

a1eXei in Церковь метрик

Terry Filch

пс, там записи с PromCon 2019 выложили

YouTube

Prometheus Monitoring

Talks and other videos about the Prometheus (https://prometheus.io) monitoring system.

спс, схоронил, потом посмотрю

источник

18:00пожаловаться #15

дш

даниил шаманов in Церковь метрик

Всем привет, задам, наверное, сейчас очень глупый вопрос)
Есть небольшой микросервис (5 типов приложений), все приложения на ноде.
Необходимо:
1 организовать нормальную систему логирования, с группировкой по типу человеческой веб мордой оповещениями и прочими возможными плюшками
сейчас под логирование выведен отдельный сервис, который тупо ловит по http и пересылает все исключения в мессенджер...
2 иметь понятия о нагрузке на систему в общем. По сути весь функционал системы сводится к обработке событий и взаимодействию с внешними API. хотелось бы иметь возможность знать хотя бы кол. событий по времени и время обработки события....
3 Ловить исключения с клиента (web), требования аналогичны 1 пункту

Все сервисы уже для старта используют pm2 для загрузки и кластеризации. Pm2 имеет собственно веб морду, но она не удовлетворяет всем потребностям и имеет как по мне не оправданную цену -_-
2 пункт можно решить через связку небольшой самописный костыль к pm2 + influxdb + grafana (на это уже есть готовое решение в закромах и по ресурсам оно весьма дешево требуется лишь influxdb)
1 и 3 пункт смотрю в сторону Sentry (минимум настроек, но ограничение 5к событий на бесплатной версии) или же стек ELK (ограничений как я понял нет, но много софта настраивать + отдельный сервак...)
Я сейчас вижу 2 варианта:
1 pm2 + influxdb + grafana для метрик и Sentry для исключений
2 ELK, и к Logstash прикручиваем исключения + метрики необходимые
Посоветуйте, как все это собрать во едино c минимумом затрат(время/финансы), возможно кто-то подскажет другой стек для данной задачи)

и да, сори за портяну текста...
пологаю с всеми вводными проще будет дать совет)

источник

18:47пожаловаться #16

A

Alexander in Церковь метрик

даниил шаманов

Всем привет, задам, наверное, сейчас очень глупый вопрос)
Есть небольшой микросервис (5 типов приложений), все приложения на ноде.
Необходимо:
1 организовать нормальную систему логирования, с группировкой по типу человеческой веб мордой оповещениями и прочими возможными плюшками
сейчас под логирование выведен отдельный сервис, который тупо ловит по http и пересылает все исключения в мессенджер...
2 иметь понятия о нагрузке на систему в общем. По сути весь функционал системы сводится к обработке событий и взаимодействию с внешними API. хотелось бы иметь возможность знать хотя бы кол. событий по времени и время обработки события....
3 Ловить исключения с клиента (web), требования аналогичны 1 пункту

Все сервисы уже для старта используют pm2 для загрузки и кластеризации. Pm2 имеет собственно веб морду, но она не удовлетворяет всем потребностям и имеет как по мне не оправданную цену -_-
2 пункт можно решить через связку небольшой самописный костыль к pm2 + influxdb + grafana (на это уже есть готовое решение в закромах и по ресурсам оно весьма дешево требуется лишь influxdb)
1 и 3 пункт смотрю в сторону Sentry (минимум настроек, но ограничение 5к событий на бесплатной версии) или же стек ELK (ограничений как я понял нет, но много софта настраивать + отдельный сервак...)
Я сейчас вижу 2 варианта:
1 pm2 + influxdb + grafana для метрик и Sentry для исключений
2 ELK, и к Logstash прикручиваем исключения + метрики необходимые
Посоветуйте, как все это собрать во едино c минимумом затрат(время/финансы), возможно кто-то подскажет другой стек для данной задачи)

и да, сори за портяну текста...
пологаю с всеми вводными проще будет дать совет)

Выглядит так, словно тебе нужны error tracking и мониторинг с метриками. И, возможно, еще и логи.

Во-первых, зачем группировать логи? Задача логирования — это формирование потока сообщений, из которого можно понять, как происходила работа программы в более-менее штатном режиме. Здесь нужна только возможность делать запросы с фильтрами по определенным полям, и совершенно нечего агрегировать, т.к. в конечном итоге за логами приходят, когда нужно понять поведение системы в конкретном случае, а не за статистической информацией. То, что ты хочешь, больше похоже на error tracking с отловом нештатного поведения кода и дедупликацией одинаковых стектрейсов, но это совсем другая система, с логированием не связанная.
Для error tracking смотри в сторону sentry (других готовых self-hosted альтернатив нет).

Во-вторых, информация о нагрузке и, в принципе, о любых численных характеристиках — это предметная область системы работы с метриками, с которой логи, обычно, тоже почти никак не связаны (да, можно формировать метрики по логам, но лучше не надо). Мониторинг, обычно, тоже делается по метриками, т.к. формируются они на основе превышения каких-либо пороговых значений. Для этого есть несколько разных инструментов, в этом чате обычно обсуждают prometheus и alert-manager, но что лучше на твоих масштабах хз.

В-третьих, см. "во-первых" про sentry. И, да, не надо ловить эксепшены через логи.

источник

19:06пожаловаться #17

дш

даниил шаманов in Церковь метрик

Alexander

Выглядит так, словно тебе нужны error tracking и мониторинг с метриками. И, возможно, еще и логи.

Во-первых, зачем группировать логи? Задача логирования — это формирование потока сообщений, из которого можно понять, как происходила работа программы в более-менее штатном режиме. Здесь нужна только возможность делать запросы с фильтрами по определенным полям, и совершенно нечего агрегировать, т.к. в конечном итоге за логами приходят, когда нужно понять поведение системы в конкретном случае, а не за статистической информацией. То, что ты хочешь, больше похоже на error tracking с отловом нештатного поведения кода и дедупликацией одинаковых стектрейсов, но это совсем другая система, с логированием не связанная.
Для error tracking смотри в сторону sentry (других готовых self-hosted альтернатив нет).

Во-вторых, информация о нагрузке и, в принципе, о любых численных характеристиках — это предметная область системы работы с метриками, с которой логи, обычно, тоже почти никак не связаны (да, можно формировать метрики по логам, но лучше не надо). Мониторинг, обычно, тоже делается по метриками, т.к. формируются они на основе превышения каких-либо пороговых значений. Для этого есть несколько разных инструментов, в этом чате обычно обсуждают prometheus и alert-manager, но что лучше на твоих масштабах хз.

В-третьих, см. "во-первых" про sentry. И, да, не надо ловить эксепшены через логи.

пардон логи группировать не требуется, группировка применима только к error tracking

источник

19:08пожаловаться #18

A

Alexander in Церковь метрик

даниил шаманов

пардон логи группировать не требуется, группировка применима только к error tracking

сентря это делает. Ложных срабатываний у нее пока этом месте я не замечал.

источник

19:09пожаловаться #19

дш

даниил шаманов in Церковь метрик

Alexander

сентря это делает. Ложных срабатываний у нее пока этом месте я не замечал.

угу, тоесть волшебной палочки нет
логи, исключения и метрики это разные сферы с разными инструментами, верно понял?

источник

19:11пожаловаться #20