Size: a a a

Церковь метрик

2020 March 11

AR

Alexey Remizov in Церковь метрик
Вот это главное помнить:
Usually, the only valid use case for the Pushgateway is for capturing the outcome of a service-level batch job
https://prometheus.io/docs/practices/pushing/
источник

VL

Vethopheth Lephanim in Церковь метрик
Yerzhan Zhiyentayev
Да, container_memory_failcnt похоже на правду)
у меня только что oom сработал на 2х машинах убив процессы от которых докер контейнер не сдох и там эта метрика по нулям, и напротив есть контейнеры где она не нулевая и при этом оом на машине вообще не спавнился. Я снова что-то не так понял, да? :(
источник

YZ

Yerzhan Zhiyentayev in Церковь метрик
источник

VL

Vethopheth Lephanim in Церковь метрик
сорян за хайлайт)
источник

VL

Vethopheth Lephanim in Церковь метрик
в общем вопрос открыт: нужно что-то чтоб мониторить оом на машинах
источник

IY

Ilya Yakimavets in Церковь метрик
Я dmesg грепал)
источник

VL

Vethopheth Lephanim in Церковь метрик
ну если нет альтеернатив, то придётся костыль вбить и textfile collector юзать)
источник

A

Andor in Церковь метрик
netconsole + rsyslogd + экспортер из текста на выбор
источник

NZ

Nikolay Zykov in Церковь метрик
node_exporter разве не умеет oom мониторить?
источник

A

Alexander in Церковь метрик
Vethopheth Lephanim
у меня только что oom сработал на 2х машинах убив процессы от которых докер контейнер не сдох и там эта метрика по нулям, и напротив есть контейнеры где она не нулевая и при этом оом на машине вообще не спавнился. Я снова что-то не так понял, да? :(
Возможно, если oom глобальный, а не cgroup-ный, то метрика не накручивается (но тогда вопрос к твоему подходу к управлению ресурсами нод).
источник

VL

Vethopheth Lephanim in Церковь метрик
Nikolay Zykov
node_exporter разве не умеет oom мониторить?
я не нашёл там такой метрики
источник

AR

Alexandr Revko in Церковь метрик
Vethopheth Lephanim
в общем вопрос открыт: нужно что-то чтоб мониторить оом на машинах
мы у себя telegraf и лог парсер его используем
источник

AR

Alexandr Revko in Церковь метрик
метрики, правда, в, проси хоспаде, инфлюкс шлются, но работает как нужно
источник

A

Alexander in Церковь метрик
Vethopheth Lephanim
у меня только что oom сработал на 2х машинах убив процессы от которых докер контейнер не сдох и там эта метрика по нулям, и напротив есть контейнеры где она не нулевая и при этом оом на машине вообще не спавнился. Я снова что-то не так понял, да? :(
Также вопросы есть по поводу того, как так получается, что у тебя кильнулись воркеры в контейнере, а мастер-процесс этого не заметил.
источник

NZ

Nikolay Zykov in Церковь метрик
node_vmstat_oom_kill
источник

VL

Vethopheth Lephanim in Церковь метрик
у меня такой нет :(
источник

NZ

Nikolay Zykov in Церковь метрик
vmstat нужно включить наверное
источник

VL

Vethopheth Lephanim in Церковь метрик
Alexander
Также вопросы есть по поводу того, как так получается, что у тебя кильнулись воркеры в контейнере, а мастер-процесс этого не заметил.
дык это скорее вопрос к приложению что там крутится
источник

VL

Vethopheth Lephanim in Церковь метрик
vmstat у меня есть в отдаваемых метриках, нет именно node_vmstat_oom_kill
источник

VL

Vethopheth Lephanim in Церковь метрик
ну ясно почему. Оно берётся из /proc/vmstat - oom_kill , а у меня там банально такого нет. Будь трижды счастлив редхат и иже с ним
источник