Size: a a a

2021 March 24

ЯШ

Ярослав Шумаков... in Tarantool
R-omk
да у меня кубер,  мне интерфейс вообще не нужен ,   мне нужно чтобы я мог написать ci  который будет сотни раз в час поднимать картридж и прогонять автоматические сценарии без участия человека
Вот пример того как это делается в тестах самого каржа: https://github.com/tarantool/cartridge/blob/master/test/integration/failover_stateful_test.lua
источник

R

R-omk in Tarantool
т.е. картридж в принципе не приспособлен к тому что чтобы подниматься самостоятельно в нужной последовательности , а оператор который есть не умеет даже роли настраивать , понятно
источник

DS

Dmitry Sharonov in Tarantool
R-omk
так картридж к этому моменту уже должен быть запущен  получается, мне кажется что stateful failover  это то что должно быть настроено сильно раньше чем стартуют пользовательские  роли
нет, почему?
источник

DS

Dmitry Sharonov in Tarantool
то же самое про бутстрап вшарда например
источник

DS

Dmitry Sharonov in Tarantool
но вот про то что оператор должен бы уметь это из коробки тут не поспоришь
источник

R

R-omk in Tarantool
Dmitry Sharonov
то же самое про бутстрап вшарда например
да я видел бустрап vahard ,   я очень внимательно его видел ... его невозможно автоматизировать  потому что он расчитан на то что все всегда работает и не ломается
источник

R

R-omk in Tarantool
Dmitry Sharonov
то же самое про бутстрап вшарда например
но я знаю как то обойти,   для этого достаточно в картридже сделать момент бусрапа vsahrd  таким чтобы    в моменте существовал ровно один репликасет (желательно с одной репликой)  и атомарно поднять спейсы vshard ,  
это может  делать либо оператор либо картридж   ,  и мне кажется что кртридж руля настройками кластера   должен это делать самостоятельно.

и толшько после бустрапа vshard мастшабирвать кластер до необходимых размеров, т.к. процес ребалоанса уже eventually и поломать его невозможно
источник

R

R-omk in Tarantool
без этой фичи говорить про автоматические прогонки    старта кластера в котором больше одного репликасета  без участия человека невозможно
источник

ЯШ

Ярослав Шумаков... in Tarantool
R-omk
но я знаю как то обойти,   для этого достаточно в картридже сделать момент бусрапа vsahrd  таким чтобы    в моменте существовал ровно один репликасет (желательно с одной репликой)  и атомарно поднять спейсы vshard ,  
это может  делать либо оператор либо картридж   ,  и мне кажется что кртридж руля настройками кластера   должен это делать самостоятельно.

и толшько после бустрапа vshard мастшабирвать кластер до необходимых размеров, т.к. процес ребалоанса уже eventually и поломать его невозможно
Удачи Вам на этом пути!
источник

ЯШ

Ярослав Шумаков... in Tarantool
R-omk
без этой фичи говорить про автоматические прогонки    старта кластера в котором больше одного репликасета  без участия человека невозможно
Посмотрите внимательно тучу тест-кейсов не только в Карже, но и в других модулях и не изобретайте велосипед, все уже написано
источник

R

R-omk in Tarantool
Ярослав Шумаков
Посмотрите внимательно тучу тест-кейсов не только в Карже, но и в других модулях и не изобретайте велосипед, все уже написано
там какойто другой vsahrd?
источник

ЯШ

Ярослав Шумаков... in Tarantool
Например
источник

R

R-omk in Tarantool
R-omk
но я знаю как то обойти,   для этого достаточно в картридже сделать момент бусрапа vsahrd  таким чтобы    в моменте существовал ровно один репликасет (желательно с одной репликой)  и атомарно поднять спейсы vshard ,  
это может  делать либо оператор либо картридж   ,  и мне кажется что кртридж руля настройками кластера   должен это делать самостоятельно.

и толшько после бустрапа vshard мастшабирвать кластер до необходимых размеров, т.к. процес ребалоанса уже eventually и поломать его невозможно
вот код

https://github.com/tarantool/cartridge/blob/6b09c02/cartridge/roles/vshard-router.lua#L145-L178

и  он ниразу не eventually ,   либо bootstrap_group падает на старте  потому что кого то из репликасетов нет,
либо если ему показалось что репликасеты все есть
то вызывается  бутстрап vsahrd     который может не увидеть  все репликастеы  и    здраствуй  NO_ROUTE_TO_BUCKET Bucket 13264 cannot be found.     и ручной запуск  bucket_force_create
источник

MO

Maxat Oralbaev in Tarantool
Yaroslav Dynnikov
а вообще

local sock = socket('AF_INET', 'SOCK_DGRAM', 'udp')
local ok = sock:bind('0.0.0.0', port)
if not ok then
   local err = string.format(
       'Socket bind error (%s/udp): %s',
       port, sock:error()
   )
   log.error(err)
   error(err, 2)
end
привет 🖐 спасибо за ответ я пока эту задачу приостановил из за приоритетов.
источник

i

igoreha in Tarantool
Привет!
Подскажите пожалуйста по метрикам CPU: tnt_cpu_thread (total|count)
Как написать запрос в prometheus, чтобы вернуть процент загрузки процессора?
источник

OU

Oleg Utkin in Tarantool
igoreha
Привет!
Подскажите пожалуйста по метрикам CPU: tnt_cpu_thread (total|count)
Как написать запрос в prometheus, чтобы вернуть процент загрузки процессора?
sum by (instance, file_name, thread_name, kind) (idelta(tnt_cpu_thread[5s]) / on (instance) group_left idelta(tnt_cpu_total[5s]) * 24)
24 - количество ядер
источник

at

agusik t in Tarantool
Я не бот
источник

AP

Andrey Privalov in Tarantool
источник

DS

Dmitry Sharonov in Tarantool
я вот в себе не уверен
источник

DL

Dmitry Lukovkin in Tarantool
Добрый вечер. Вопрос теоретический, но с практическим смыслом.
Что должно такое произойти в реплике M-M на ТТ 1.10, чтобы на разных реплицируемых инстансах были расхождения в данных? Ну т.е. грубо говоря на интансе 1 "А=1", а на на интсансе 2 и на всех остальных "А=2"? Пару раз это происходило и природа сего события мне не понятна.  По идее это в корне разрушает весь смысл слова "реплика".
P.S. Не реплицируемых спейсов нет.
P.P.S replication_skip_conflict = true
Вдогонку еще вопрос: Существует ли в природе простой способ(если нет, то планируется ли такое в будущем) "перезагрузки" данных на одном из инстансов в реплике? Потому как описанный способ "перезапуска" репликации описанный в доке: https://www.tarantool.io/ru/doc/1.10/book/replication/repl_reseed/ по мне так мало чем отличается от фактически настройки репликации заново. При большом количестве инстансов в реплике это становится уже достаточно трудоемким процессом, хотя и решающим проблему.
источник