Size: a a a

SPb Reliability Meetup

2019 February 13

ST

Sergey Trapeznikov in SPb Reliability Meetup
чьей обязанностью является оценка стоимости реализации комплекса мер по повышению высокой доступности проекта, SRE или аналитика?
источник

K

Konstantin in SPb Reliability Meetup
Sergey Trapeznikov
чьей обязанностью является оценка стоимости реализации комплекса мер по повышению высокой доступности проекта, SRE или аналитика?
Что подразумевается под оценкой? Посчитать цифры? или оценить надо оно или нет? Цифры может посчитать любой, оценить необходимость таких затрат врядли может сделать и тот и другой, но принять в этом участие должны)
источник

p

ppavel in SPb Reliability Meetup
pragus
А вот расскажите за балансеры: кто чем пользуется, какие хелсчеки итп
Я агитирую за nginx
можно писать самому, можно брать Plus (который умеет стучаться к нодам и  проверять на живость)
источник

ST

Sergey Trapeznikov in SPb Reliability Meetup
Konstantin
Что подразумевается под оценкой? Посчитать цифры? или оценить надо оно или нет? Цифры может посчитать любой, оценить необходимость таких затрат врядли может сделать и тот и другой, но принять в этом участие должны)
анализируется текущий дизайн системы на возможные отказы;
составляется список сценариев отказа;
для каждого сценария указывается вероятность отказа и урон, им созданный;
важные сценарии для бизнеса фиксируются в требованиях;
проектирование решений по преодолению этих сценариев, оценивается стоимость реализации;
ревью решений, проверка гипотез по преодолению отказов;
источник

ST

Sergey Trapeznikov in SPb Reliability Meetup
грубо говоря вот у тебя есть сервис и ты хочешь сделать его максимально отказоустойчивым, ты продумал список действий для достижения этой цели, а о цене реализации кому надо думать? манагеру или SRE? ведь надо учитывать еще и тот факт, что бизнесу может быть выгоднее потерять какую то часть сервиса на какое то время, вместо проведения данной модернизации
источник

K

Konstantin in SPb Reliability Meetup
Sergey Trapeznikov
анализируется текущий дизайн системы на возможные отказы;
составляется список сценариев отказа;
для каждого сценария указывается вероятность отказа и урон, им созданный;
важные сценарии для бизнеса фиксируются в требованиях;
проектирование решений по преодолению этих сценариев, оценивается стоимость реализации;
ревью решений, проверка гипотез по преодолению отказов;
Если у вас есть аналитик, то скорее всего отвественность за составление подобного документа лежит на нем. При составление его, он должен привлекать различных специалистов для отражения всех сторон поставленных вопросов. Решение о реализации того или иного осуществляет Product Owner или кто-либо другой кто отвечает за продукт.
источник

ST

Sergey Trapeznikov in SPb Reliability Meetup
допустим не только ресурсы выйдут в конечном счете в виде денег, но и человекочасы за работу, оценка сроков реализации и тп
источник

ST

Sergey Trapeznikov in SPb Reliability Meetup
понял спс
источник

p

pragus in SPb Reliability Meetup
ppavel
Я агитирую за nginx
можно писать самому, можно брать Plus (который умеет стучаться к нодам и  проверять на живость)
Nginx совсем не балансер и я не представляю как резервировать отказ машины с ним
источник

p

ppavel in SPb Reliability Meetup
Не балансер для чего, конкретный сценарий есть?
источник

p

pragus in SPb Reliability Meetup
ppavel
Не балансер для чего, конкретный сценарий есть?
Да для всего )) те же вебсокеты, например. Или grpc.

Нет ни политик балансировки, ни мониторинга апстримов.

Ну и весь трафик должен ходить через хост с nginx.
источник

p

pragus in SPb Reliability Meetup
Второй вопрос, связанный с первым: а кто как и на чем строит geo?
источник

p

ppavel in SPb Reliability Meetup
Главное очереди не используй
твой кейс всё еще неочевиден, задача вообще секретная?
источник

AS

Aleksey Shirokikh in SPb Reliability Meetup
Рома, зависит от SLO. Быть может что его не надо резервировать ибо сделав это ты ухудшишь ситуацию в целом. А может и нужно и потеря некоторого колва соединений при отказе или переключении не критична
источник

p

pragus in SPb Reliability Meetup
Aleksey Shirokikh
Рома, зависит от SLO. Быть может что его не надо резервировать ибо сделав это ты ухудшишь ситуацию в целом. А может и нужно и потеря некоторого колва соединений при отказе или переключении не критична
Ну если у тебя все коннекты терминируются на балансере, то гибель балансера порвет все коннекты
источник

AS

Aleksey Shirokikh in SPb Reliability Meetup
и пусть ?
источник

AS

Aleksey Shirokikh in SPb Reliability Meetup
или было предположение что нельзя ?
источник

p

pragus in SPb Reliability Meetup
ppavel
Главное очереди не используй
твой кейс всё еще неочевиден, задача вообще секретная?
Веб-сайт в нескольких локациях с реалтайм данными. Пусть будет браузерная игра, по типу танчиков.
источник

p

pragus in SPb Reliability Meetup
Aleksey Shirokikh
или было предположение что нельзя ?
Нельзя, народ играет
источник

AS

Aleksey Shirokikh in SPb Reliability Meetup
оо. годный кейс
источник