Size: a a a

Церковь метрик

2020 February 19

ST

Sergey Trapeznikov in Церковь метрик
Paul Rudnitskiy
process_exporter, спасибо
👍🏻
источник

VL

Vethopheth Lephanim in Церковь метрик
а node_exporter --collector.processes так не умеет?
источник

AS

Aleksey Shirokikh in Церковь метрик
Vethopheth Lephanim
а node_exporter --collector.processes так не умеет?
выглядит будто бы оно вообще про другое
источник

K

KK in Церковь метрик
Приветствую, комрадс!
Занимался нагрузочным тестированием prometheus в k8s ( со стандартной TSDB, которая определена в promtheus-operator ).

Поставил тест и пошел пить чай. Когда пришел, прометей в циклической перезагрузке, т.к. пытается загрузить все данные из TSDB в RAM, ему не хватает RAM, OOM-killer его грохает и так по кругу.
Нагрузочный тест конечно отключил, но как почистить TSDB от тестовых логов не знаю (контейнер не поднимается, поэтому через REST не могу его почистить).
Может быть можно как-то загрузить прометей, чтобы он не выедал всю память  (с каким-то спецефическим флагом)?

Вопросы:
1) Кто-нибудь может подскзать, как почистить TSDB от ненужных метрик, если prometheus не запускается ?
2) С помощью Victoria Metrics( или Thanos например) можно же избежать подобных проблем (переполнение памяти) ? Если есть уже описанные подобные кейсы, просьба кинуть линк.
источник

AS

Aleksey Shirokikh in Церковь метрик
1. в нагрузочном тестировании напиши -- не прошёл.
2. да но нет. пром всё равно сдохнет когда получит овермиллион кардиналити. но смысл ведь в том что бы понять когда именно он склеит ласты и держаться ниже этого числа
источник

K

KK in Церковь метрик
Aleksey Shirokikh
1. в нагрузочном тестировании напиши -- не прошёл.
2. да но нет. пром всё равно сдохнет когда получит овермиллион кардиналити. но смысл ведь в том что бы понять когда именно он склеит ласты и держаться ниже этого числа
2. Собственно ради этого и проводил тестирование..
источник

AS

Aleksey Shirokikh in Церковь метрик
раз это было нагрузочное забейте на этот пром. его уже не спасти
источник

AS

Aleksey Shirokikh in Церковь метрик
если же данные оттуда хочется спасти начните с чистки wal диры
источник

A

Andor in Церковь метрик
> Занимался нагрузочным тестированием prometheus

я же правильно угадал что ты в него писал метрики с рандомными лейблами?
источник

K

KK in Церковь метрик
Aleksey Shirokikh
раз это было нагрузочное забейте на этот пром. его уже не спасти
оххх, досадно…
А причина, почему грохнулся, потому что он хранит TSDB в памяти (или чем он всю память забил) ?
источник

AS

Aleksey Shirokikh in Церковь метрик
KK
оххх, досадно…
А причина, почему грохнулся, потому что он хранит TSDB в памяти (или чем он всю память забил) ?
нет. он хранит индекс в памяти
источник

K

KK in Церковь метрик
Andor
> Занимался нагрузочным тестированием prometheus

я же правильно угадал что ты в него писал метрики с рандомными лейблами?
Ну лейблы рандомные утилита генерит при старте, далее они повторяются при обновлении данных
источник

AS

Aleksey Shirokikh in Церковь метрик
и этот индекс дорос до состояния когда в него уже не впихнуть
источник

A

Andor in Церковь метрик
KK
Ну лейблы рандомные утилита генерит при старте, далее они повторяются при обновлении данных
сколько миллионов уникальных таймсерий было?
источник

K

KK in Церковь метрик
Andor
сколько миллионов уникальных таймсерий было?
Не знаю , я пришел - уже все лежало
источник

AS

Aleksey Shirokikh in Церковь метрик
KK
Ну лейблы рандомные утилита генерит при старте, далее они повторяются при обновлении данных
в таком тесте очень не много смысла. такие данные не будут жаться. реальные данные будут очень сильно отличаться от вашей синтетики
источник

A

Andor in Церковь метрик
как это "не знаю"?
источник

A

Andor in Церковь метрик
а генерилка никуда не записывала, что ли?
источник

K

KK in Церковь метрик
Andor
а генерилка никуда не записывала, что ли?
первым делом я ее убил, сейчас залезу в elk поищу ее логи
источник

K

KK in Церковь метрик
Aleksey Shirokikh
в таком тесте очень не много смысла. такие данные не будут жаться. реальные данные будут очень сильно отличаться от вашей синтетики
ясно, учту при следующих итерациях
источник