Size: a a a

2020 January 17

ST

Sergey Trapeznikov in DevOps DrinkUp
надо кликабельное
источник

S

SeniorAnykey in DevOps DrinkUp
у кого есть идеи как отловить причины рандомного ребута/падения виртуалки под qemu ? syslog и dmesg девственно чисты.
источник

ST

Sergey Trapeznikov in DevOps DrinkUp
вот у тебя условно инфра в ньюйорке, у тебя на карте хоба линк питер-ньюйорк
тыкаешь туда, там группа серверов, адреса и маршрут
и зеленое красное типа есть там или нет

в идеале если зеленое красное еще и к алертам привязать))
источник

ST

Sergey Trapeznikov in DevOps DrinkUp
источник

Н

Никита in DevOps DrinkUp
SeniorAnykey
у кого есть идеи как отловить причины рандомного ребута/падения виртуалки под qemu ? syslog и dmesg девственно чисты.
смотреть в логи мониторинга на момент падения, конфиг виртуалки
источник

S

SeniorAnykey in DevOps DrinkUp
Никита
смотреть в логи мониторинга на момент падения, конфиг виртуалки
да нет там нихуя, втом и проблема
источник

S

SeniorAnykey in DevOps DrinkUp
ехало ехало - пиздык - лежим
источник

ST

Sergey Trapeznikov in DevOps DrinkUp
SeniorAnykey
да нет там нихуя, втом и проблема
они не могут быть чисты
если внутри чисто, значит это виртуалки и их убивает гипер
источник

ST

Sergey Trapeznikov in DevOps DrinkUp
мониторинг тоже не может быть чистый - цпу-память-диск смотреть
источник

Н

Никита in DevOps DrinkUp
ну если в гипервизоре пустота, то скорее всего проблемы с qemu "железом" или драйверами
источник

S

SeniorAnykey in DevOps DrinkUp
Sergey Trapeznikov
они не могут быть чисты
если внутри чисто, значит это виртуалки и их убивает гипер
да, а у гипера логи как у хлебушка. я про эту гавну первый раз слышу - ganeti
источник

Н

Никита in DevOps DrinkUp
вообще можно strace натравить на процесс виртуалки из гипервизора
источник

S

SeniorAnykey in DevOps DrinkUp
Никита
вообще можно strace натравить на процесс виртуалки из гипервизора
была идея, только неугадаешь когда оно свалится. а strace скажем за 4-5 суток вычитать - ну хз
источник

Н

Никита in DevOps DrinkUp
SeniorAnykey
была идея, только неугадаешь когда оно свалится. а strace скажем за 4-5 суток вычитать - ну хз
так важны последние секунды, остальное можно не хранить
источник

EG

Evgeniy Glumnushin in DevOps DrinkUp
Sergey Trapeznikov
(придется значит просто в draw.io рисовать регионы  )
Где-то была готовая херня, в какой-то системе мониторинга.
Там у тебя был сорт оф глобус интерактивный или карта, там ноды были натыканы, которые мониторятся
источник

EG

Evgeniy Glumnushin in DevOps DrinkUp
Но я забыл где
источник

EG

Evgeniy Glumnushin in DevOps DrinkUp
Sergey Trapeznikov
вот у тебя условно инфра в ньюйорке, у тебя на карте хоба линк питер-ньюйорк
тыкаешь туда, там группа серверов, адреса и маршрут
и зеленое красное типа есть там или нет

в идеале если зеленое красное еще и к алертам привязать))
Но такого там не было, конечно, просто типа карта сети была
источник

ST

Sergey Trapeznikov in DevOps DrinkUp
Evgeniy Glumnushin
Где-то была готовая херня, в какой-то системе мониторинга.
Там у тебя был сорт оф глобус интерактивный или карта, там ноды были натыканы, которые мониторятся
ПЕЗДААААТА
источник

ST

Sergey Trapeznikov in DevOps DrinkUp
вот такое в идеалах нада)
источник

ST

Sergey Trapeznikov in DevOps DrinkUp
а то ебал я мониторить несколько дц по планете
источник