Size: a a a

SPb Reliability Meetup

2019 January 23

МS

Михаил SinTeZoiD in SPb Reliability Meetup
Dmitry Nazarov
а как сюда добавить имиджевые потери?
А как их посчитать?
источник

МS

Михаил SinTeZoiD in SPb Reliability Meetup
Aleks Mayer
Как и в дикую эпоху без SRE.
Как будто сейчас у кого-то есть нормальный SRE отдел
источник

МS

Михаил SinTeZoiD in SPb Reliability Meetup
кроме 3-5 компаний
источник

AS

Alexander Salimonov in SPb Reliability Meetup
Через customer satisfaction можно что-то насчитать, если поток лидов в принципе прогнозируемый, на основе него тоже
источник

AS

Alexander Salimonov in SPb Reliability Meetup
Данные есть - можно что-то смоделировать, нет - ну и оценок нет.
источник

AS

Alexander Salimonov in SPb Reliability Meetup
Васе с 1С и кассовыми терминалом SRE не нужен, так как надёжность и на пальцах можно оценить. А гуглу нужен, минус девятка или лишние 40мс в латенси — уже проблемы с конверсией.
источник

AS

Aleksey Shirokikh in SPb Reliability Meetup
Vitaliy Levchenko
мы ценим практические доклады, а не пересказ SRE book
Меня очень смутил факт того что не смотря на четкие формулировки и требования от Гугла что и как должно быть в sre ты ввел свои формулировки. Это фрагментирует и подменяет понятия.
источник

AS

Aleksey Shirokikh in SPb Reliability Meetup
Ладно когда это произошло с прошлым словом. Парни из феникса наплевали. Но Гугл нет.
источник

DN

Dmitry Nazarov in SPb Reliability Meetup
с прошлым это каким?
источник

AS

Aleksey Shirokikh in SPb Reliability Meetup
Девопс
источник

AS

Aleksey Shirokikh in SPb Reliability Meetup
Если задача была в том чтобы предложить своё видение стоило так и сделать. Но из песни слово не выбросить.
источник

AS

Aleksey Shirokikh in SPb Reliability Meetup
По книжке например видно что от одного человека универсальных знаний не ждут и существует специализация даже внутри. Например ярко были подчёркнуты database sre
источник

AS

Aleksey Shirokikh in SPb Reliability Meetup
Да и сложно мне представить наличие универсальных sre в промышленных масштабах. С той тишейпностью будут получаться квадратики.
источник

VR

Vsevolod Rodionov in SPb Reliability Meetup
кстати, про error budget - Яндекс - если не путаю - изменяет не по времени даунтайма, а по % 5хх ошибок (и аналогичных метрик), что им позволяет достаточно гибко шаманить и уходить в даунтайм в 3 утра в субботу на полчасика что-нибудь обновить, хотя в рабочий день эквивалетный бюджет бы выжрался за 1-2 минуты
источник

AS

Alexander Salimonov in SPb Reliability Meetup
так везде специализация будет, практически очевидно.
источник

AS

Alexander Salimonov in SPb Reliability Meetup
один девопс может хорошо nginx тераформом по клауду размазывать, а другой DWH в он-премис держать. Совершенно разные знания нужны
источник

AS

Aleksey Shirokikh in SPb Reliability Meetup
Vsevolod Rodionov
кстати, про error budget - Яндекс - если не путаю - изменяет не по времени даунтайма, а по % 5хх ошибок (и аналогичных метрик), что им позволяет достаточно гибко шаманить и уходить в даунтайм в 3 утра в субботу на полчасика что-нибудь обновить, хотя в рабочий день эквивалетный бюджет бы выжрался за 1-2 минуты
Да, Гугл тоже рисует соотношение good events/valid events
источник

AS

Aleksey Shirokikh in SPb Reliability Meetup
Alexander Salimonov
один девопс может хорошо nginx тераформом по клауду размазывать, а другой DWH в он-премис держать. Совершенно разные знания нужны
Вчера от Виталия я услышал вот этот запрос. Возможно вопрос восприятия или внутренего конфликта
источник

AS

Aleksey Shirokikh in SPb Reliability Meetup
Возможно требования универсальности годны в контексте команды sre
источник

AR

Andrey Romanov in SPb Reliability Meetup
Aleksey Shirokikh
Да, Гугл тоже рисует соотношение good events/valid events
только это sli, а не error budget. а так да, основная идея юзать бизнес метрики и метрики user happiness, а не инфраструктурные метрики (cpu, hdd и тд)
источник