Size: a a a

SPb Reliability Meetup

2020 May 02

AV

Alexey Velikiy in SPb Reliability Meetup
Спасибо большое за ссылки
источник

rd

rus dacent in SPb Reliability Meetup
Качество, конечно, на 100 сжатых шакалов из 10, но мне было интересно

Мы в Amixr.IO проксируем через себя IT инциденты и доставляем их клиентам в удобном виде. Я расскажу о том, почему вокруг обработки инцидентов такой хайп, что интересного можно узнать от сотен инстансов Grafana, или Aletrtmanager, покажу короткий action план по наведению порядка и о том, почему получать инциденты хорошо даже если Вы — бекендер.


Каково это — будить IT команды клиентов 200000 раз в месяц
https://www.youtube.com/watch?v=E3_G1u-SI8M
источник
2020 May 06

rd

rus dacent in SPb Reliability Meetup
источник

PR

Paul Rudnitskiy in SPb Reliability Meetup
опять не спать (
источник

rd

rus dacent in SPb Reliability Meetup
Paul Rudnitskiy
опять не спать (
А ты заставь себя! =)
источник

W

Womchik in SPb Reliability Meetup
/me давно забил смотреть это вот всйо
источник
2020 May 09

rd

rus dacent in SPb Reliability Meetup
Доклады с Seattle SRE Meetup

Embracing service-level-objectives of your microservices in your Cl/CD
https://youtu.be/qJXeDHfJkIU?t=432

Reliability Since the Dawn of the Internet
https://youtu.be/qJXeDHfJkIU?t=2040

Слайды
https://www.dropbox.com/sh/6n3mdxaxrzfcbvb/AAAfnF5Gg-dUMNBxNjhen43xa?dl=0
источник
2020 May 10

rd

rus dacent in SPb Reliability Meetup
Google's SRE Team shares their Best Practices
https://www.youtube.com/watch?v=Z_WlK1c1eJ4
источник

rd

rus dacent in SPb Reliability Meetup
Managing Chaos in Production: Testing vs Monitoring
https://www.youtube.com/watch?v=r-2oVm1emc0
источник
2020 May 11

rd

rus dacent in SPb Reliability Meetup
6 практических историй из наших SRE-будней
https://habr.com/ru/company/flant/blog/471892/
источник
2020 May 12

rd

rus dacent in SPb Reliability Meetup
На Медиуме есть автор Стив Мушеро (Steve Mushero), который много пишет о SRE и о подходах к мониторингу по этой методологии. Здесь он пишет про золотые сигналы SRE (Latency, Traffic, Errors, and Saturation), методики USE и RED, но есть и статьи о метриках, которые он рекомендует собирать в контексте SRE по конкретным элементам систем. Ниже подборка таких статей.

Метрики балансировщика (AWS ALB/ELB, HAProxy)

Метрики веб-серверов (Apache & Nginx)

Метрики серверов приложений (PHP, FPM, Java, Ruby, Node, Go, Python)

Метрики серверов баз данных (MySQL & AWS RDS и AWS Aurora)

Метрики Линукс-серверов (Linux)
источник
2020 May 13

rd

rus dacent in SPb Reliability Meetup
Dave McAllister из Splunk
RED (Rates, Errors, Duration) is designed for monitoring microservices. RED gives you the framework to build alerting, monitoring and analysis into a flexible structure to meet the emerging needs of services-based cloud-native architectures and give you the capability to grow as your environment scales. By seeing multiple dimensions, we can monitor and focus to get to root cause faster, with less false positives and quicker resolution. We’ll look at how signals impact observability. The RED approach will help reduce your production issues and fail panics we all see.

Seeing RED
https://www.youtube.com/watch?v=aI3o_YRGabc

RED (Rates, Errors, Duration) was a spinoff from Google’s Golden Signals designed for monitoring microservices. However, RED use has clearly demonstrated that the applicability is applicable to any services-based architecture. With RED, unlike the modern belief in observability, your architecture is watched from aspects of multiple dimensions. You receive alerts and indications not just from anomalies, but also from headache alerts. By seeing multiple dimensions of concerns, be they failures in service or activity to close to the edge of capability, these combined monitors and deep-dive, focused access get you to your root cause faster, with less false positives and quicker resolution.

https://www.socallinuxexpo.org/scale/18x/presentations/seeing-red - более подробное описание доклада
источник
2020 May 14

EG

Eduard Generalov in SPb Reliability Meetup
источник

ST

Sergey Trapeznikov in SPb Reliability Meetup
источник

VL

Vitaliy Levchenko in SPb Reliability Meetup
хороший заголовок для доклада
источник

AS

Aleksey Shirokikh in SPb Reliability Meetup
я бы наверное заказал такую футболочку. но только её сейчас носить некуда
источник

EG

Eduard Generalov in SPb Reliability Meetup
Aleksey Shirokikh
я бы наверное заказал такую футболочку. но только её сейчас носить некуда
Дорисовать на аву?)
источник

W

Womchik in SPb Reliability Meetup
Aleksey Shirokikh
я бы наверное заказал такую футболочку. но только её сейчас носить некуда
мусор выносить в такой
источник

rd

rus dacent in SPb Reliability Meetup
Aleksey Shirokikh
я бы наверное заказал такую футболочку. но только её сейчас носить некуда
На митинги.
источник

AS

Aleksey Shirokikh in SPb Reliability Meetup
rus dacent
На митинги.
с другими sre ?
источник