Size: a a a

SPb Reliability Meetup

2020 February 28

s

sexst in SPb Reliability Meetup
То есть прибивается не то, в чём нужно проблему искать
источник

s

sexst in SPb Reliability Meetup
И можно долго копать не в ту сторону вообще
источник

p

pragus in SPb Reliability Meetup
sexst
А может у тебя нормально работающее приложение по score должно быть прибито, а реально в нём всё в порядке и штатно, а течёт другое.
В score там таблица же.
источник

s

sexst in SPb Reliability Meetup
И?
источник

p

pragus in SPb Reliability Meetup
Из кандидатов на отстрел
источник

s

sexst in SPb Reliability Meetup
Текущее поджирает сраные полпроцента оставшейся свободной памяти, а работающее нормально годами занимало и занимает 90 процентов.
источник

s

sexst in SPb Reliability Meetup
В таких условиях ты текущее даже в топе кандидатов на отстрел не увидишь
источник

s

sexst in SPb Reliability Meetup
И будешь долго копать не туда
источник

A

Anatoly in SPb Reliability Meetup
Огурчик шарит
источник
2020 February 29

p

pragus in SPb Reliability Meetup
sexst
И будешь долго копать не туда
Да ну. Во-первых, есть oom_kill_allocating_task

Во-вторых, можно просто запретить oom убивать определенные процессы
источник

s

sexst in SPb Reliability Meetup
pragus
Да ну. Во-первых, есть oom_kill_allocating_task

Во-вторых, можно просто запретить oom убивать определенные процессы
1) Что тоже нихрена не гарантирует того, что будет прибито именно то приложение что нужно.
2) Дыг чтобы запретить, нужно знать что это точно не оно, а мы не знаем
источник

s

sexst in SPb Reliability Meetup
Короче говоря, есть некоторый вагон боли в поиске такого вот на плотно упакованных по утилизации памяти системах
источник

s

sexst in SPb Reliability Meetup
Хотя да, в 95% ситуаций все очевидно сразу
источник

s

sexst in SPb Reliability Meetup
Ну и oom_kill_allocating_task весьма спорная фича. Это по сути стрельба во все стороны наугад и с закрытыми глазами.
источник

DN

Dmitry Nagovitsin in SPb Reliability Meetup
pragus
Так а ощутимо на чем? Он там из procfs долго выгребает?
Да, я как-то поймал скрейп тайм-аут на 10 секундсх
источник

DN

Dmitry Nagovitsin in SPb Reliability Meetup
sexst
1) Что тоже нихрена не гарантирует того, что будет прибито именно то приложение что нужно.
2) Дыг чтобы запретить, нужно знать что это точно не оно, а мы не знаем
Ну не зря пишутся альтернативы для линухового оом.
источник

DN

Dmitry Nagovitsin in SPb Reliability Meetup
Фейсбук написал чёт, помню
источник

DN

Dmitry Nagovitsin in SPb Reliability Meetup
Сигрупы помогают для "обжор" обычно
источник

AS

Aleksey Shirokikh in SPb Reliability Meetup
они же не альтернативы а дополняторы
источник

AS

Aleksey Shirokikh in SPb Reliability Meetup
и если я правильно понимаю не успеют отработать если приложеничка не медленно течет а прям хорошо так
источник