Size: a a a

SPb Reliability Meetup

2019 March 24

DN

Dmitry Nagovitsin in SPb Reliability Meetup
Алертить на уровне сервисов
источник

DN

Dmitry Nagovitsin in SPb Reliability Meetup
А дальше дрилдаун анализ
источник

ST

Sergey Trapeznikov in SPb Reliability Meetup
Тогда получается доступность сервиса(если это один хост) будет измеряться

((сумма_доступности_всех_процессов\количество_процессов) + доступность_хоста)\2?)
источник

p

pragus in SPb Reliability Meetup
Sergey Trapeznikov
Тогда получается доступность сервиса(если это один хост) будет измеряться

((сумма_доступности_всех_процессов\количество_процессов) + доступность_хоста)\2?)
Вы что хотите получить в результате таких вычислений?
источник

ST

Sergey Trapeznikov in SPb Reliability Meetup
pragus
Вы что хотите получить в результате таких вычислений?
доступность сервиса в целом
источник

ST

Sergey Trapeznikov in SPb Reliability Meetup
(если сервис = 1 хост)
источник

M

Magistr in SPb Reliability Meetup
что такое сервис ? а если сервис отдает 502 на запросы но доступен ?
источник

M

Magistr in SPb Reliability Meetup
или даже 503
источник
2019 March 25

DN

Dmitry Nagovitsin in SPb Reliability Meetup
Sergey Trapeznikov
Тогда получается доступность сервиса(если это один хост) будет измеряться

((сумма_доступности_всех_процессов\количество_процессов) + доступность_хоста)\2?)
Доступность сервиса = доступность сервиса
источник

DN

Dmitry Nagovitsin in SPb Reliability Meetup
При чем тут хосты?
источник

DN

Dmitry Nagovitsin in SPb Reliability Meetup
У тебя при падении хоста перестает быть доступным сервис?
источник

ST

Sergey Trapeznikov in SPb Reliability Meetup
Dmitry Nagovitsin
У тебя при падении хоста перестает быть доступным сервис?
по факту это единственная незадублированная точка, которая особо не нуждается в защите от нагрузок и тп

если хост упадет то в целом да
источник

ST

Sergey Trapeznikov in SPb Reliability Meetup
и надо бы определить что ты имеешь ввиду под сервисом
если ты подразумеваешь определенный домен как сервис в целом, это одно
если мы говорим о сервисе как о группе хостов, с определенными компонентами, выполняющих определенную функцию в проекте в целом, как один из его сервисов, это другое
и тут по сути требуется измерять доступность каждого такого сервиса ВНУТРИ проекта, я вел к этому
источник

DN

Dmitry Nagovitsin in SPb Reliability Meetup
Sergey Trapeznikov
и надо бы определить что ты имеешь ввиду под сервисом
если ты подразумеваешь определенный домен как сервис в целом, это одно
если мы говорим о сервисе как о группе хостов, с определенными компонентами, выполняющих определенную функцию в проекте в целом, как один из его сервисов, это другое
и тут по сути требуется измерять доступность каждого такого сервиса ВНУТРИ проекта, я вел к этому
Сервис это обычно ендпоинт для бизнес процесса
источник

NK

Nick Kritsky in SPb Reliability Meetup
Sergey Trapeznikov
и надо бы определить что ты имеешь ввиду под сервисом
если ты подразумеваешь определенный домен как сервис в целом, это одно
если мы говорим о сервисе как о группе хостов, с определенными компонентами, выполняющих определенную функцию в проекте в целом, как один из его сервисов, это другое
и тут по сути требуется измерять доступность каждого такого сервиса ВНУТРИ проекта, я вел к этому
Что если так: сервис - это пара “fqdn+port”?
источник

ST

Sergey Trapeznikov in SPb Reliability Meetup
Nick Kritsky
Что если так: сервис - это пара “fqdn+port”?
источник

W

Womchik in SPb Reliability Meetup
Nick Kritsky
Что если так: сервис - это пара “fqdn+port”?
и не важно там 200, 501, 503 или udp?
источник

DN

Dmitry Nagovitsin in SPb Reliability Meetup
Оспаде, да прочитайте уже главу в сре буке про мониторинг
источник

DN

Dmitry Nagovitsin in SPb Reliability Meetup
На Хабре был перевод
источник

DN

Dmitry Nagovitsin in SPb Reliability Meetup
Выше уже задавали кучу наводящих вопросов
источник