Size: a a a

Церковь метрик

2020 March 17

VS

Vasilyev Sergey in Церковь метрик
Есть 100500 каких-то невнятных алертов
источник

VS

Vasilyev Sergey in Церковь метрик
эммм? Это как?
источник

AS

Aleksey Shirokikh in Церковь метрик
вот эти 100500 они внятные и по делу
источник

A

Andor in Церковь метрик
в kube-prometheus есть некоторое количество алертов, но они не про поды
источник

AS

Aleksey Shirokikh in Церковь метрик
а про то что какой то под cpu жрет... ну ок его полимитит. если сильно будет лимитить про это есть алерт
источник

AS

Aleksey Shirokikh in Церковь метрик
если памяти много сожрет его куб убъет. про это есть алерт
источник

AS

Aleksey Shirokikh in Церковь метрик
на ноду нельзя зашедулить ресурсов больше чем есть
источник

AS

Aleksey Shirokikh in Церковь метрик
так что глобально с нодой такой беды быть не может
источник

VS

Vasilyev Sergey in Церковь метрик
Ясно)
Спасибо. Думал, что может не увидел. Пойду искать готовое. Может уже кто-то написал
источник

AS

Aleksey Shirokikh in Церковь метрик
я ничо не понял но удачи :)
источник

A

Andor in Церковь метрик
Vasilyev Sergey
Гайз, а подскажите пожалуйста:
В базовом сетапе прометеус-оператора нет алертов для High CPU или Memory Usage ???
мне кажется что в первом случае у тебя должна быть нотификация о троттлинге, а во втором - об ООМ
если нет ООМ, значит память утилизируется нормально и нет смыcла алертить
источник

A

Andor in Церковь метрик
троттлинг во многих случаях приемлим
источник

VS

Vasilyev Sergey in Церковь метрик
Andor
троттлинг во многих случаях приемлим
правильно. Я вот тоже люблю мониторинг по косвенным признакам
источник

A

Alexander in Церковь метрик
Vasilyev Sergey
правильно. Я вот тоже люблю мониторинг по косвенным признакам
Троттлинг cpu влияет только на время ответа. И мониторить надо, в первую очередь именно его. А на троттлинг (и не только) смотреть глазами, если есть просадки по времени ответа
источник

A

Alexander in Церковь метрик
При этом появление троттлинга сильно зависит от паттерна использования cpu. Если у тебя большая амплитуда и есть высокие пики, то они будут скрести о cfs_quota в рамках cfs_period-а, но на большую часть нагрузки влиять будут незначительно.
источник

A

Alexander in Церковь метрик
В этом плане алерт на троттлинг легко может стать постоянно раздражающим false positive.
источник

AS

Aleksey Shirokikh in Церковь метрик
у меня он и стал. в сайленсе почти все
источник

A

Alexander in Церковь метрик
@s2504s Короче, мониторь в первую очередь характеристики сервиса, а остальное просто собирай для получения общей картины при траблшутинге.
источник

VS

Vasilyev Sergey in Церковь метрик
Alexander
@s2504s Короче, мониторь в первую очередь характеристики сервиса, а остальное просто собирай для получения общей картины при траблшутинге.
Спасибо за развернутый ответ👍
источник

IE

Ivan EKbfh in Церковь метрик
првиет!
Кто-то знает, как можно на лету при импорте оверрайтнуть датасурс для дашборда графаны?
В json он прописан тупо по имени, например "datasource": "MyLovelyDatasource"
источник