Size: a a a

2020 July 21

S

Slach in uptime.community
Magistr
это же инвестиции в обучение
ну да =) завалил базу, заплатил за обучение как базу поднять =) вполне норм =)

не. я думаю просто часто импакт СЛОЖНО посчитать
особенно для SaaS какого нибудь с подпиской... когда клиент будет голосовать рублем сильно позже чем случается инцидент
источник

GM

Gleb Mekhrenin in uptime.community
Igor
Я переформулирую вопрос в сторону абстрактности:
например, если в результате действий сисадмина упала база на 10 минут. Был разбор инцидента, пост-мортем, и фикс процессов, чтобы такого больше не повторялось.

Надо ли сисадмину знать, сколько стоило это падение по деньгам для операционной деятельности конторы?
Если 100к? Если 10 миллионов?
это вообще невероятно клевая компания если они умеют такие вещи посчитать - это намного адекватнее чем просто полежали и какие-то абстрактные клиенты просто пострадали
источник

M

Magistr in uptime.community
по идее сервелесс и фукнции позволяет понимать стоимость обработки запроса + считать бенефиты и стоимости рефакторинга каждого куска кода
источник

J

JTProgru in uptime.community
Igor
можно сломать связность без прямого доступа к бд, или накатить не тот конфиг на кластер. У нас гипотетическая ситуация без прямого умысла.
ну это конечно можно =)
просто я к тому, что если в обычной деятельности (в типичный будень) админ полез в базу которая отвечает за дохрена денег, то ему сразу надо дать по шапке.
работы такого рода должны проводиться в нерабочее время, риски закладываются, шаги обкатываются на дев/стейдж/локалхост

ЗЫЖ У меня под рукой джун одмин. По неграмотности ребутнул два сервака (стэйдж, но этот стэйдж клиент смотрит постоянно). На вопрос Зачем? он ответил Да я посмотрел кто на сервере сидит (сессии) и увидел что никого нет - вот и ребутнул.
А серваки были кривым кластером галеры - наследие =)
Так вот пошапке он не получил - а смысл? Объяснить что Ай-яй-яй объяснили. Но репутационные ляпы прилетели - в момент ребута клиент сильно смотрел туда и тестировал что-то.
источник

b

bofh666 in uptime.community
JTProgru
ну это конечно можно =)
просто я к тому, что если в обычной деятельности (в типичный будень) админ полез в базу которая отвечает за дохрена денег, то ему сразу надо дать по шапке.
работы такого рода должны проводиться в нерабочее время, риски закладываются, шаги обкатываются на дев/стейдж/локалхост

ЗЫЖ У меня под рукой джун одмин. По неграмотности ребутнул два сервака (стэйдж, но этот стэйдж клиент смотрит постоянно). На вопрос Зачем? он ответил Да я посмотрел кто на сервере сидит (сессии) и увидел что никого нет - вот и ребутнул.
А серваки были кривым кластером галеры - наследие =)
Так вот пошапке он не получил - а смысл? Объяснить что Ай-яй-яй объяснили. Но репутационные ляпы прилетели - в момент ребута клиент сильно смотрел туда и тестировал что-то.
Ну так это проблемы не админа-джуна явно :)
источник

J

JTProgru in uptime.community
bofh666
Ну так это проблемы не админа-джуна явно :)
Факт! Поэтому я и получил по шапке и до начальства не дошло =)
источник

I

Igor in uptime.community
> На вопрос Зачем? он ответил Да я посмотрел кто на сервере сидит (сессии) и увидел что никого нет - вот и ребутнул.

мне напомнило историю с реддита когда чувак в первый день работы продакшн бд снёс, потому что она заявлась как тестовая
https://www.reddit.com/r/cscareerquestions/comments/6ez8ag/accidentally_destroyed_production_database_on/
источник

b

bofh666 in uptime.community
Igor
> На вопрос Зачем? он ответил Да я посмотрел кто на сервере сидит (сессии) и увидел что никого нет - вот и ребутнул.

мне напомнило историю с реддита когда чувак в первый день работы продакшн бд снёс, потому что она заявлась как тестовая
https://www.reddit.com/r/cscareerquestions/comments/6ez8ag/accidentally_destroyed_production_database_on/
Дадада)
источник

J

JTProgru in uptime.community
Igor
> На вопрос Зачем? он ответил Да я посмотрел кто на сервере сидит (сессии) и увидел что никого нет - вот и ребутнул.

мне напомнило историю с реддита когда чувак в первый день работы продакшн бд снёс, потому что она заявлась как тестовая
https://www.reddit.com/r/cscareerquestions/comments/6ez8ag/accidentally_destroyed_production_database_on/
Угу
Я тож эту историю вспомнил - но позже =)
источник

D

Dima in uptime.community
Igor
Я переформулирую вопрос в сторону абстрактности:
например, если в результате действий сисадмина упала база на 10 минут. Был разбор инцидента, пост-мортем, и фикс процессов, чтобы такого больше не повторялось.

Надо ли сисадмину знать, сколько стоило это падение по деньгам для операционной деятельности конторы?
Если 100к? Если 10 миллионов?
По мне так нет.

1.Если админ косячит по тупости и криворукости его надо увольнять.
2. Если ему пофиг и творит фигню типо и так пойдет, то опять же увольнять.
3. Если из-за не хватки знаний и опыта то учить и объяснять.
4. Если из-за какой то не зависящай фигни, то притензии к этой фигне.

Какая разница сколько это стоит.

Перефразирую, если человек максимально хорошо в силу своих знаний делает работу. Нет смысла его парить. А указание на бабло будет именно как вынос мозга.
Если хреново, то это вы этого человека взяли и это ваш косяк как руководителя что он ещё работает.
источник

J

JTProgru in uptime.community
Dima
По мне так нет.

1.Если админ косячит по тупости и криворукости его надо увольнять.
2. Если ему пофиг и творит фигню типо и так пойдет, то опять же увольнять.
3. Если из-за не хватки знаний и опыта то учить и объяснять.
4. Если из-за какой то не зависящай фигни, то притензии к этой фигне.

Какая разница сколько это стоит.

Перефразирую, если человек максимально хорошо в силу своих знаний делает работу. Нет смысла его парить. А указание на бабло будет именно как вынос мозга.
Если хреново, то это вы этого человека взяли и это ваш косяк как руководителя что он ещё работает.
+++
источник

b

bofh666 in uptime.community
Dima
По мне так нет.

1.Если админ косячит по тупости и криворукости его надо увольнять.
2. Если ему пофиг и творит фигню типо и так пойдет, то опять же увольнять.
3. Если из-за не хватки знаний и опыта то учить и объяснять.
4. Если из-за какой то не зависящай фигни, то притензии к этой фигне.

Какая разница сколько это стоит.

Перефразирую, если человек максимально хорошо в силу своих знаний делает работу. Нет смысла его парить. А указание на бабло будет именно как вынос мозга.
Если хреново, то это вы этого человека взяли и это ваш косяк как руководителя что он ещё работает.
Дядя не умеет внимательно читать? ;) Вопрошающий спросил про blameless культуру и указание иvпакта от инцидента в пересчете на бабло в постмортеме.
источник

D

Dima in uptime.community
постморн нужен что бы разобрать как можно решить проблему. Что бы она не повторялась. А не что бы найти виноватых и долбать людям мозг.

Указание на бабло нужно руковдству, например что бы сказать зачем покупать новое железо. Но админу как наемному сотруднику эта инфа не нужна.
источник

D

Dima in uptime.community
В целом тема подобных разборов тонка. И не знаю как заграницей. Но в РФ это обычно скатывается в поиск виноватых и попытки лишить премий. Поэтому воспринимается рабониками негативно. И поэтому там начнают писать хрень, а не реальные причины инцедента.
источник

b

bofh666 in uptime.community
Dima
постморн нужен что бы разобрать как можно решить проблему. Что бы она не повторялась. А не что бы найти виноватых и долбать людям мозг.

Указание на бабло нужно руковдству, например что бы сказать зачем покупать новое железо. Но админу как наемному сотруднику эта инфа не нужна.
А ничего, что постмортем пишется для команды в целом? И накосячить мог не только админ, а цепочка людей? А сумма, имхо, дисциплинирует. Типа тимбилдинг. Это отличная идея, ИМХО.
источник

b

bofh666 in uptime.community
Dima
В целом тема подобных разборов тонка. И не знаю как заграницей. Но в РФ это обычно скатывается в поиск виноватых и попытки лишить премий. Поэтому воспринимается рабониками негативно. И поэтому там начнают писать хрень, а не реальные причины инцедента.
Тогда это какая-то шляпа и попытки в модное-молодежное)) С таким настроением они слона не продадут
источник

D

Dima in uptime.community
bofh666
А ничего, что постмортем пишется для команды в целом? И накосячить мог не только админ, а цепочка людей? А сумма, имхо, дисциплинирует. Типа тимбилдинг. Это отличная идея, ИМХО.
Это игра называется, найди виноватого и выдумай причину.
источник

I

Igor in uptime.community
bofh666
А ничего, что постмортем пишется для команды в целом? И накосячить мог не только админ, а цепочка людей? А сумма, имхо, дисциплинирует. Типа тимбилдинг. Это отличная идея, ИМХО.
> сумма, имхо, дисциплинирует. Типа тимбилдинг.

Люди будут бояться косячить. Move fast and break things уже не работает.
источник

VS

Vladimir Smirnov in uptime.community
Igor
Как вы думаете, можно ли заявлять blameless культуру но при этом писать в пост-мортемах о стоимости инцидента для компании?
Картинку взял из доклада додопиццы https://www.youtube.com/watch?v=OWSebmnuhBw
Это по прежнему блеймлесс и нормальная практика оценки ущерба
источник

D

Dima in uptime.community
Никто не захочет признать например что он косякнул и поэтому компания потеряла пол ляма баксов.
источник