Size: a a a

Церковь метрик

2020 May 11

AN

Artem Navoiev in Церковь метрик
если они подвисли
источник

ST

Sergey Trapeznikov in Церковь метрик
Alyx G00dwin
Helm prometheus-operator удалил, но остались следы. Как их вычистить? kubectl delete pod не помогает. Среди Deployment все чисто
helm delete my-release --purge
источник

ST

Sergey Trapeznikov in Церковь метрик
это вообще в куберчат скорее чем сюда вопрос
источник

ST

Sergey Trapeznikov in Церковь метрик
источник

AP

Anton Patsev in Церковь метрик
Sergey Trapeznikov
а нафига там используются rpm репы для экспортеров? эж фигня полная что для apt что для rpm, вон даже в репе обновления для некоторых экспортеров были полтора года назад
лучший способ это на мой взгляд тар тянуть и вокруг бинаря свой сервис описывать, и пути кастомные будут и тп
Да кто против? Примеры запаздывания экспортёров в rpm?
источник

ST

Sergey Trapeznikov in Церковь метрик
источник

AG

Alexey Genus in Церковь метрик
Кто-нибудь знает, как работает rate? Что-то не могу понять, почему он иногда теряет значения. Вот пример ниже, на котором $interval = 1min. если поставить $interval 30s (равным scrape_interval), то график с ним вообще возвращает пустоту.
Читаю вот это https://prometheus.io/docs/prometheus/latest/querying/functions/#rate и это https://medium.com/@valyala/why-irate-from-prometheus-doesnt-capture-spikes-45f9896d7832 и озарения не приходит.
источник

AG

Alexey Genus in Церковь метрик
источник

AG

Alexey Genus in Церковь метрик
Т.е. вместо того, чтобы показывать мне 0.0167 ops, он показывает 0.3, но реже, чем это необходимо.
источник

A

Alexander in Церковь метрик
Alexey Genus
Т.е. вместо того, чтобы показывать мне 0.0167 ops, он показывает 0.3, но реже, чем это необходимо.
Делай лучше rate(sum()), чем sum(rate())
источник

AG

Alexey Genus in Церковь метрик
Но в доке же написано противоположное. И это логично, потому что так не будут ломаться перезагрузки.
Вообще, в данном запросе там ровно одна серия, так что sum вообще ничего менять не должен.
источник

A

Alexander in Церковь метрик
Alexey Genus
Но в доке же написано противоположное. И это логично, потому что так не будут ломаться перезагрузки.
Вообще, в данном запросе там ровно одна серия, так что sum вообще ничего менять не должен.
Ну, если есть перегрузки, то да.
источник

AG

Alexey Genus in Церковь метрик
Короче, смена функций местами ничего не меняет. Даже, если убрать sum, результат аналогичный. Дело в rate, это точно.
источник

A

Alexander in Церковь метрик
Alexey Genus
Кто-нибудь знает, как работает rate? Что-то не могу понять, почему он иногда теряет значения. Вот пример ниже, на котором $interval = 1min. если поставить $interval 30s (равным scrape_interval), то график с ним вообще возвращает пустоту.
Читаю вот это https://prometheus.io/docs/prometheus/latest/querying/functions/#rate и это https://medium.com/@valyala/why-irate-from-prometheus-doesnt-capture-spikes-45f9896d7832 и озарения не приходит.
Работает он, по идее, как приращение за указанный интервал, нормированное по секундам. С экстраполяцией данных, если есть необходимость.
источник

A

Alexander in Церковь метрик
В любом случае, не стоит считать rate() точным, это индикатор для примерной оценки динамики приращения метрики.
источник

A

Alexander in Церковь метрик
И, вообще, сам prometheus не стоит считать хранилищем точных данных, раз уж на то пошло :)
источник

S

Slach in Церковь метрик
а никто не знает в графана есть какой то аналог /etc/grafana/config.d/*.ini ???
чтобы можно было часть grafana.ini переопределить?

или только provisioners с yaml файлами?
источник

AG

Alexey Genus in Церковь метрик
Alexander
В любом случае, не стоит считать rate() точным, это индикатор для примерной оценки динамики приращения метрики.
Ну это в некотором роде позор😕 Я бы, конечно, не отказался смотреть на эти данные, как на примерные, но я бы хотел понимать, насколько они примерные.

Судя по всему, нужно переходить на rollup от VM. Но только у меня почему-то VM на тестовом контуре, а на прод её ставить не хотят.
источник

A

Alexander in Церковь метрик
Alexey Genus
Ну это в некотором роде позор😕 Я бы, конечно, не отказался смотреть на эти данные, как на примерные, но я бы хотел понимать, насколько они примерные.

Судя по всему, нужно переходить на rollup от VM. Но только у меня почему-то VM на тестовом контуре, а на прод её ставить не хотят.
Это не позор, это такова предметная область: ты не тратишь кучу ресурсов на сбор и хранение точных данных, но за это расплачиваешься погрешностями при сборе метрик (timestamp выставляется в prome-е и может расходиться с временем актуальности метрики в экспортере), при хранении и при обработке (точка, в конечном счете, должна быть выровнена по периоду таймсерии, что уже само по себе вызывает необходимость в интерполяции).
Если тебе нужны абсолютно точные данные (например, потому что тебе нужно хранить бизнес-метрики), то prom (и, вообще, системы для работы с техническими метриками) — неподходящий для этого инструмент.
источник

AG

Alexey Genus in Церковь метрик
Да я ж говорю: я готов мириться с погрешностями, я просто хочу понимать, какая она. Кстати, все это я понимаю, но на моем графике четко видно, что все данные выровнены, а результат все равно непонятный
источник