Size: a a a

SPb Reliability Meetup

2019 June 14

VL

Vitaliy Levchenko in SPb Reliability Meetup
pragus
Дедлайны, таймауты, отмена :( это будет больно. Лучше сразу в своем сервисе это сделать, а наружу только результат или ошибку
ну таки да, работа с транзакциями гораздо сложнее, чем тупо пробросить запрос во внешнюю систему
источник

AS

Aleksey Shirokikh in SPb Reliability Meetup
Заложи отказы системы в slo своего продукта. Перенести риски на бизнес уровень. Сам ретрай и делай лучшее что можешь
источник

VL

Vitaliy Levchenko in SPb Reliability Meetup
о, ответ настоящего SRE!
источник

AS

Aleksey Shirokikh in SPb Reliability Meetup
Может бизнес найдет инфопартнера лучше
источник

AS

Aleksey Shirokikh in SPb Reliability Meetup
Или сможет поднять качество сервиса через платежи партнёру
источник

DN

Dmitry Nazarov in SPb Reliability Meetup
узкая ниша, там их всего пара штук. А этот ещё прилично работает по сравнению с.
источник

DN

Dmitry Nazarov in SPb Reliability Meetup
Да и косты переезда будут космические во всех разрезах
источник

DN

Dmitry Nazarov in SPb Reliability Meetup
так что только обкладывать всем чем можно )
источник
2019 June 15

AS

Alexander Salimonov in SPb Reliability Meetup
Что за ниша? Просто любопытство
источник

AS

Alexander Salimonov in SPb Reliability Meetup
Dmitry Nazarov
2) система изображает из себя stateless, а ведёт себя как stateful, причём в худшем проявлении (очень неявно внутри себя хранит какой-то стейт, вследствие чего падает при попытке поменять порядок обращений к ней). аналогичный вопрос: какие есть техники чтобы обложить такую фигню соломкой? только интеграционные тесты?
Это всегда головняк. Если у вас в тестах есть то, что вы не контролируете (каналы, днс, хреновая политика апдейтов, любящий шатать сервис контрагент), то они периодически будут флапать и ломаться. С этим только жить.
А так интеграционные тесты в помощь и статистику по ним. Если какие-то тесты валятся регулярно, то на фоне них надо различать какие другие тесты поломались или позеленели.

Некоторые кэширование запрещают соглашениями/контрактами.
источник

AS

Alexander Salimonov in SPb Reliability Meetup
По статистике смотрите что чаще всего падает, пинайте чтобы чинили на той стороне, либо обкладывайте ретрай/фоллбэк политиками, уменьшайте slo, флаподав настраивайте
источник
2019 June 17

p

pragus in SPb Reliability Meetup
источник

p

pragus in SPb Reliability Meetup
Всем патчиццо. Теперь официально :)
источник

МS

Михаил SinTeZoiD in SPb Reliability Meetup
pragus
Всем патчиццо. Теперь официально :)
Выключать tcp_sack скорее
источник

МS

Михаил SinTeZoiD in SPb Reliability Meetup
Патча то ещё нет
источник

IE

Ivan EKbfh in SPb Reliability Meetup
источник
2019 June 18

AS

Aleksey Shirokikh in SPb Reliability Meetup
А тут есть sre? Замечено что некоторые не понимают разницу между ReadTimeout и Connection Timeout. Не говоря об остальных ошибках сети. Может у кого есть в голове структурированная информация и ею не против поделится?
источник

VL

Vitaliy Levchenko in SPb Reliability Meetup
Aleksey Shirokikh
А тут есть sre? Замечено что некоторые не понимают разницу между ReadTimeout и Connection Timeout. Не говоря об остальных ошибках сети. Может у кого есть в голове структурированная информация и ею не против поделится?
Кстати да, доклад по тайм-аутам очень нужен
источник

VL

Vitaliy Levchenko in SPb Reliability Meetup
Могу сделать, если хотите
источник

SM

Serg Martynov in SPb Reliability Meetup
Aleksey Shirokikh
А тут есть sre? Замечено что некоторые не понимают разницу между ReadTimeout и Connection Timeout. Не говоря об остальных ошибках сети. Может у кого есть в голове структурированная информация и ею не против поделится?
Слушай, не встречал такого ничего🤷‍♂
источник