Size: a a a

2021 March 04

АЖ

Андрей Жуков... in Data Engineers
Evgeny
кажется, что правильный путь - уходить от хардкода памяти\ядер и динамически считать все это дело с помощью ansible\salt\puppet
Хм, а как это должно выглядеть?
источник

A

Alex in Data Engineers
Обычно разные конфигурации в разные группы запихиваются и по группе уже конфиг цпу-память
источник

A

Alex in Data Engineers
Что в ярне. Что в ансибле
источник

E

Evgeny in Data Engineers
Андрей Жуков
Хм, а как это должно выглядеть?
      yarn.nodemanager.resource.cpu-vcores: '{{ grains['num_cpus'] - 1 }}'
     yarn.nodemanager.resource.memory-mb: '{{ (grains['mem_total'] * 0.7) | round | int }}'

например
источник

АЖ

Андрей Жуков... in Data Engineers
Evgeny
      yarn.nodemanager.resource.cpu-vcores: '{{ grains['num_cpus'] - 1 }}'
     yarn.nodemanager.resource.memory-mb: '{{ (grains['mem_total'] * 0.7) | round | int }}'

например
а, в плане раскатки

я думал, что-то динамически менять
источник

E

Evgeny in Data Engineers
не, я про хардкод ресурсов
источник

АЖ

Андрей Жуков... in Data Engineers
с блюпринтов у меня подгорало в свое время
источник

E

Evgeny in Data Engineers
у меня ваниль, так что, ничего не подгорает :)
источник

E

Evgeny in Data Engineers
Андрей Жуков
а, в плане раскатки

я думал, что-то динамически менять
ну, в целом, никто не мешает раскатываться при изменении характеристик тачек. Вполне динамично получится :) тем более, что nodemanager стартует быстро, в отличие от датаноды
источник

АЖ

Андрей Жуков... in Data Engineers
Evgeny
ну, в целом, никто не мешает раскатываться при изменении характеристик тачек. Вполне динамично получится :) тем более, что nodemanager стартует быстро, в отличие от датаноды
не, с этим понятно, я подумал, какие-то другие интересные идеи, до которых я не додумался :)
источник

АЖ

Андрей Жуков... in Data Engineers
какие-нибудь многопрофильные ноды, с которых  иногда нужно ярн выгонять
источник

E

Evgeny in Data Engineers
сложна. а если выгонять, то и пригонять, и ограничивать в ресурсах придётся. Жизнь - боль
источник

AZ

Anton Zadorozhniy in Data Engineers
Evgeny
кажется, что правильный путь - уходить от хардкода памяти\ядер и динамически считать все это дело с помощью ansible\salt\puppet
this
только так и нужно делать, вы же менеджмент код не для одного забега пишете
источник

AZ

Anton Zadorozhniy in Data Engineers
более того, можно иметь нодгруппы с оверкоммитом по ядрам, такие прото-оппортунистические контейнеры, чтобы утилизацию повышать, туда приземлять всякий адхок ворклоад
источник

T

T in Data Engineers
Evgeny
кажется, что правильный путь - уходить от хардкода памяти\ядер и динамически считать все это дело с помощью ansible\salt\puppet
О я так делал на emr  передним стоял скриптик и в зависимости от входных данных конфигурировал кластер. Очень сильно у простил мою жизнь особенно вплане онколов - ночи стали спокойней
источник

AZ

Anton Zadorozhniy in Data Engineers
да, для пайплайнов это гораздо лучше чем автоскейлеры всяких видов
источник

AZ

Anton Zadorozhniy in Data Engineers
другой вопрос что сайзить надо под самое широкое место пайплайна, и утилизация перед и после будет страдать, но это уже часть данного кактуса
источник

E

Evgeny in Data Engineers
Anton Zadorozhniy
более того, можно иметь нодгруппы с оверкоммитом по ядрам, такие прото-оппортунистические контейнеры, чтобы утилизацию повышать, туда приземлять всякий адхок ворклоад
а нодгруппы лейблами резать?
источник

AZ

Anton Zadorozhniy in Data Engineers
Evgeny
а нодгруппы лейблами резать?
да
источник

K

KrivdaTheTriewe in Data Engineers
Anton Zadorozhniy
другой вопрос что сайзить надо под самое широкое место пайплайна, и утилизация перед и после будет страдать, но это уже часть данного кактуса
Хорошо когда сервера одинаковые
источник