Size: a a a

VictoriaMetrics_ru

2019 June 03

s

sensory deprivation in VictoriaMetrics_ru
и еще вопрос, поднял vm кластерной версии, проверяю, насколько он стойкий к потере стораджа, если выношу один из стораджей (2 других живы) то на графиках в графане провалы на этот интервал, это ок?
источник

AN

Artem Navoiev in VictoriaMetrics_ru
при потере одного из стораджей данные должны писатсья на соседний
источник

s

sensory deprivation in VictoriaMetrics_ru
ага, тоже на это расчитывал, но провалы :(
источник

s

sensory deprivation in VictoriaMetrics_ru
вот пром, который пишет в vm
источник

s

sensory deprivation in VictoriaMetrics_ru
вот сама vm, первый провал — роллинг апдейт стейтфулсета, дальше тестовые выносы подов стейтфулсета
источник

AN

Artem Navoiev in VictoriaMetrics_ru
то есть идет rolling update даже а не delete pod?
источник

s

sensory deprivation in VictoriaMetrics_ru
конфигурация:
2x vminsert (deployment)
2x vmselect (deployment)
3x vmstorage (statefulset с emptyDir)
источник

s

sensory deprivation in VictoriaMetrics_ru
ага
источник

s

sensory deprivation in VictoriaMetrics_ru
так же есть у стораджей сайдкары которые раз в 5 минут делают бекап и инит контейнера которые из бекапа восстанавливают
источник

AN

Artem Navoiev in VictoriaMetrics_ru
оформишь issue?
источник

s

sensory deprivation in VictoriaMetrics_ru
ага
источник

AN

Artem Navoiev in VictoriaMetrics_ru
спасибо
источник

s

sensory deprivation in VictoriaMetrics_ru
а, еще, пока удаленный pod (pod delete) не доступен — график ок, потом, когда он восстановился из бекапа — появляется провал
источник

AV

Aliaksandr Valialkin in VictoriaMetrics_ru
если бэкап делается раз в пять минут, значит, после восстановления из последнего бэкапа может быть утеряно до 5 минут данных с момента создания бэкапа до момента восстановления из него. Этим могут объясняться провалы на графиках
источник

AV

Aliaksandr Valialkin in VictoriaMetrics_ru
при апдейте vmstorage нод не нужно восстанавливаться из бэкапа - главное, чтобы они были остановлены с помощью SIGINT (aka graceful shutdown). В этом случае они должны скинуть все данные на диск перед остановкой, поэтому после обновления никакие данные не должны потеряться.
источник

AV

Aliaksandr Valialkin in VictoriaMetrics_ru
даже если vmstorage ноды убить помощью SIGKILL, то потреяется последние пару секунд данных, которые не успели скинуться на диск. В этом случае тоже не нужнжо ничего восстанавливать из бэкапа. Бэкап нужен, если данные полностью потерялись или испортились
источник

AV

Aliaksandr Valialkin in VictoriaMetrics_ru
бэкап раз в пять минут - перебор :) Когда данных мало, он еще будет кое-как работать, а когда данных наберется слишком много, они не будут успевать записываться за пять минут в архивное хранилище. Можно, конечно, делать incremental backup с помощью rsync -rL --delete раз в пять минут и полный бэкап раз в день...
источник

AV

Aliaksandr Valialkin in VictoriaMetrics_ru
разработчики netdata просят протестировать запись данных из netdata во внешнюю TSDB с помощью Prometheus remote write  - https://github.com/netdata/netdata/issues/5619#issuecomment-498237620 . Кто пользуется netdata и может это протестить в связке с VictoriaMetrics?
источник

s

sensory deprivation in VictoriaMetrics_ru
Aliaksandr Valialkin
при апдейте vmstorage нод не нужно восстанавливаться из бэкапа - главное, чтобы они были остановлены с помощью SIGINT (aka graceful shutdown). В этом случае они должны скинуть все данные на диск перед остановкой, поэтому после обновления никакие данные не должны потеряться.
в коде наше обработку SIGTERM если что, но это ок, может Я чего затупил
источник

s

sensory deprivation in VictoriaMetrics_ru
Aliaksandr Valialkin
если бэкап делается раз в пять минут, значит, после восстановления из последнего бэкапа может быть утеряно до 5 минут данных с момента создания бэкапа до момента восстановления из него. Этим могут объясняться провалы на графиках
да, уже разобрался, сам создал проблему, сам решил
источник