Size: a a a

Церковь метрик

2020 January 01

AS

Aleksey Shirokikh in Церковь метрик
Aleksey Lazarev
А промитей умеет в меньше секунды?
Разрабы говорят да но не стоит
источник

AS

Aleksey Shirokikh in Церковь метрик
А что такое поймать?
источник

AL

Aleksey Lazarev in Церковь метрик
Aleksey Shirokikh
А что такое поймать?
Просто лаба)
Еще не придумал
источник

AL

Aleksey Lazarev in Церковь метрик
Хотя рестарт какого нибудь нджинска как пример
источник

G

Grigoriy in Церковь метрик
Можно монитом такое сообщение отпралять
источник

AS

Aleksey Shirokikh in Церковь метрик
Рестарт нжинкса будет видно по смене пида
источник

G

Grigoriy in Церковь метрик
Если есть такой таск
источник

RK

Roman Khavronenko in Церковь метрик
если приложение знает о своей недоступности(таймауты на конекшенах, не 200 ск), то оно может и экспортить соответствующую метрику (счетчик), который будет аккумулировать все ошибки.
аналогично можно экспортить метрики с клиентов этого приложения, если вы контролируете их.

В случае с прометеусом всегда нужно помнить, что скрейпы происходят в случайное время и соответственно проектировать мониторинг. Например, у вас есть рейтлимитинг и вы хотите знать когда он срабатывает. Обычная метрика по кол-ву запросов может не показать этого, т.к. неизвестно когда прометеус соберет эти данные. Поэтому лучше в самом приложение записывать случаи срабатывания лимитера в отдельный счетчик и эксопртить еще и его.

Можно еще использовать https://github.com/netdata/netdata и писать в ремоут какой-то.
источник

AS

Aleksey Shirokikh in Церковь метрик
Ещё это будет видно на блекбоксе если повезёт или не будет видно вовсе. Возможно такой рестарт и не надо видеть если он не аффектит юзеров
источник

AS

Aleksey Shirokikh in Церковь метрик
Roman Khavronenko
если приложение знает о своей недоступности(таймауты на конекшенах, не 200 ск), то оно может и экспортить соответствующую метрику (счетчик), который будет аккумулировать все ошибки.
аналогично можно экспортить метрики с клиентов этого приложения, если вы контролируете их.

В случае с прометеусом всегда нужно помнить, что скрейпы происходят в случайное время и соответственно проектировать мониторинг. Например, у вас есть рейтлимитинг и вы хотите знать когда он срабатывает. Обычная метрика по кол-ву запросов может не показать этого, т.к. неизвестно когда прометеус соберет эти данные. Поэтому лучше в самом приложение записывать случаи срабатывания лимитера в отдельный счетчик и эксопртить еще и его.

Можно еще использовать https://github.com/netdata/netdata и писать в ремоут какой-то.
Всё так но про нетдату не понял. Она имеет какуюто магию?
источник

AL

Aleksey Lazarev in Церковь метрик
Aleksey Shirokikh
Рестарт нжинкса будет видно по смене пида
Это я уже сделал, хочется еще варианты поэтому нарисал
источник

A

Andor in Церковь метрик
Aleksey Lazarev
Хотя рестарт какого нибудь нджинска как пример
А ты уверен, что рестарт надо ловить именно так?
источник

AS

Aleksey Shirokikh in Церковь метрик
Aleksey Lazarev
Это я уже сделал, хочется еще варианты поэтому нарисал
Короче определится с поймать и видно. В целом если запросов не было то и не надо ловить
источник

AL

Aleksey Lazarev in Церковь метрик
Roman Khavronenko
если приложение знает о своей недоступности(таймауты на конекшенах, не 200 ск), то оно может и экспортить соответствующую метрику (счетчик), который будет аккумулировать все ошибки.
аналогично можно экспортить метрики с клиентов этого приложения, если вы контролируете их.

В случае с прометеусом всегда нужно помнить, что скрейпы происходят в случайное время и соответственно проектировать мониторинг. Например, у вас есть рейтлимитинг и вы хотите знать когда он срабатывает. Обычная метрика по кол-ву запросов может не показать этого, т.к. неизвестно когда прометеус соберет эти данные. Поэтому лучше в самом приложение записывать случаи срабатывания лимитера в отдельный счетчик и эксопртить еще и его.

Можно еще использовать https://github.com/netdata/netdata и писать в ремоут какой-то.
Почитаю спасибо
источник

AL

Aleksey Lazarev in Церковь метрик
Aleksey Shirokikh
Короче определится с поймать и видно. В целом если запросов не было то и не надо ловить
Нужно именно поймать.
источник

AL

Aleksey Lazarev in Церковь метрик
Всем Спасибо за помощь, почитаю про статью повыше)
источник

A

Andor in Церковь метрик
Можно экспортировать время запуска приложения, например
источник

RK

Roman Khavronenko in Церковь метрик
Aleksey Shirokikh
Всё так но про нетдату не понял. Она имеет какуюто магию?
частота скрейпа метрик вроде 1с, насколько я помню.
источник

AS

Aleksey Shirokikh in Церковь метрик
Roman Khavronenko
частота скрейпа метрик вроде 1с, насколько я помню.
Видел на промконе как говорили про 100мс
источник

A

Andor in Церковь метрик
Andor
Можно экспортировать время запуска приложения, например
И всё "поймать" будет в поиске когда время запуска поменялось
источник