Size: a a a

Церковь метрик

2020 March 27

W

Womchik in Церковь метрик
в параметрах запуска node_exporter
источник

YS

Yura Smirkin in Церковь метрик
Я рассматривал этот вариант, но он не очень удобен. Можно ли как-то ещё?
источник

VL

Vethopheth Lephanim in Церковь метрик
дропай лишние на проме
источник

W

Womchik in Церковь метрик
Yura Smirkin
Я рассматривал этот вариант, но он не очень удобен. Можно ли как-то ещё?
а чем он неудобен?
источник

YS

Yura Smirkin in Церковь метрик
Вопрос снимается. Сделал через metric_relabel_configs. Спасибо
источник

YS

Yura Smirkin in Церковь метрик
Womchik
а чем он неудобен?
node_exporter разливается на множества узлов(на каких-то нужны только эти данные, на каких-то другие. Соответственно вместе с ним разливается файл node_exporter.service. Придется плодить файл и усложнит раскатку. Или я не прав?
источник

W

Womchik in Церковь метрик
Yura Smirkin
node_exporter разливается на множества узлов(на каких-то нужны только эти данные, на каких-то другие. Соответственно вместе с ним разливается файл node_exporter.service. Придется плодить файл и усложнит раскатку. Или я не прав?
“но удовлетворяют регулярному выражению.” - я так понял, что с этой регуляркой можно на все применить
источник

YS

Yura Smirkin in Церковь метрик
Womchik
“но удовлетворяют регулярному выражению.” - я так понял, что с этой регуляркой можно на все применить
Нет. Видно не корректно описал. В большом пуле есть группа узлов для которых эта регулярка подходит и на них надо мониторить только по ней. На остальных другие правила
источник

АС

Антон Сенько in Церковь метрик
Антон Сенько
Всем привет.
При деплое прометеуса в куб с помощью https://github.com/helm/charts/tree/master/stable/prometheus-operator, для node_exporter генерится конфа, в которой установлено role: endpoints, от этого в метку instance помещается айпиадрес ноды, а мне нужно, чтобы было role: node, тогда в instance будет запихиваться хостнеймн ноды. Кто-нибудь знает, есть ли вменяемый способ изменить это поведение? Два дня уже вокруг этой задачи прыгаю, все бубны изломал ((
Ребят, в своих изысканиях пришел к другому вопросу. Можно ли как-то сделать дефолтный релейблинг, т.е. чтобы он применялся для всех servicemonitor'ов?
источник

A

Andor in Церковь метрик
Slach
да -)
вон оно и приехало
источник

DS

Dmitry Sergeev in Церковь метрик
Всем привет.

Решил в kubelet из метрики container_cpu_usage_seconds_total  делать такую-же но с доп лейблами из подов. Сделал такое правило:

- expr: container_cpu_usage_seconds_total{} * on (pod) group_left(label_env,label_app,label_app_type,label_version) kube_pod_labels{}
 record: container_cpu_usage_seconds_total:with_labels


И если строить графики по container_cpu_usage_seconds_total:with_labels. То выходит такой забор:
http://dl4.joxi.net/drive/2020/03/27/0030/2608/1985072/72/08e19d4a64.jpg

Но таже самая метрика если использовать тот же самый запрос что и в правиле выдает нормальный график:
http://dl4.joxi.net/drive/2020/03/27/0030/2608/1985072/72/127a34a30f.jpg

Если их вместе вывести видна разница:
http://dl3.joxi.net/drive/2020/03/27/0030/2608/1985072/72/6fdd1adfbe.jpg

Почему такие странные провалы?
источник

A

Andor in Церковь метрик
интервалы не совпадают?
источник

DS

Dmitry Sergeev in Церковь метрик
Andor
интервалы не совпадают?
интервалы сбора метрик? Или в запросах?
источник

A

Andor in Церковь метрик
сбора, аггрегации, в графике
источник

DS

Dmitry Sergeev in Церковь метрик
Andor
сбора, аггрегации, в графике
там стоит одинаковый.

Если сократить лейблы, то оба графика строятся по следующим запросам:

Нормальный график: sum(irate(container_cpu_usage_seconds_total{<labels>}[1m]) * on (pod) group_left(label_env,label_app, label_app_type) kube_pod_labels{<labels>})

И график с забором: sum(irate(container_cpu_usage_seconds_total:with_labels{<labels>}[1m]))
источник

A

Andor in Церковь метрик
а нафиг ты в агрегации делаешь irate?
источник

DS

Dmitry Sergeev in Церковь метрик
Andor
а нафиг ты в агрегации делаешь irate?
да тут без разницы же. У меня в одно минутном интервале две точки. rate и irate разве в этом случае не одинаковый результат дают?
источник

A

Andor in Церковь метрик
а, тогда одинаковый должен быть вроде, да
источник

DS

Dmitry Sergeev in Церковь метрик
Andor
а, тогда одинаковый должен быть вроде, да
ну я все равно затестил. С rate тоже самое
источник

NZ

Nikolay Zaitsev in Церковь метрик
Вопрос. Для джобы job_name:blackbox указан scrape_interval=5s, если джоба ждет данные от blackbox_exporter дольше этого интервала, то prometheus как поступает? Все равно делает новый запрос к blackbox_exporter через scrape_interval?
источник