Size: a a a

2019 July 03

A

Alex in Data Engineers
@justedro увидишь какие очереди пустые и много ли их
и те которые забиты
источник

A

Alex in Data Engineers
что изменить: отключить создание новых, создать те которые нужны, назначить дефолтную какую-либо
источник

N

Nikita Blagodarnyy in Data Engineers
О, благодарочка. Я гадал, что он за безумные названия очередей придумывает, которые никто не создавал в Capacity scheduler.
источник

EV

Eduard Vlasov in Data Engineers
пользователь один, очередь одна, шедулер Capacity Scheduler по [MEMORY]
источник

EV

Eduard Vlasov in Data Engineers
[Wed Jul 03 09:47:32 +0000 2019] Application is added to the scheduler and is not yet activated. Queue's AM resource limit exceeded. Details : AM Partition = CORE; AM Resource Request = <memory:3584, vCores:1>; Queue Resource Limit for AM = <memory:7168, vCores:1>; User AM Resource Limit of the queue = <memory:7168, vCores:1>; Queue AM Resource Usage = <memory:7168, vCores:2>;
источник

EV

Eduard Vlasov in Data Engineers
Ток не смейтесь про мой микрокластер :D
источник

N

Nikita Blagodarnyy in Data Engineers
А не тюнил maximum-am-resource-percent?
источник

N

Nikita Blagodarnyy in Data Engineers
Оно по дефолту 0.2
источник

EV

Eduard Vlasov in Data Engineers
<property>
   <name>yarn.scheduler.capacity.maximum-am-resource-percent</name>
   <value>0.5</value>
   <description>
     Maximum percent of resources in the cluster which can be used to run
     application masters i.e. controls number of concurrent running
     applications.
   </description>
 </property>
источник

N

Nikita Blagodarnyy in Data Engineers
По-моему, я что-то похожее лечил тюнингом этого параметра
источник

N

Nikita Blagodarnyy in Data Engineers
До 0.7
источник

EV

Eduard Vlasov in Data Engineers
🤔 связи пока не вижу но надо попробовать
источник

AS

Andrey Smirnov in Data Engineers
Eduard Vlasov
пользователь один, очередь одна, шедулер Capacity Scheduler по [MEMORY]
а сколько памяти выделяется одному контейнеру, может оставшийся свободной недостаточно для нового контейнера?
источник

EV

Eduard Vlasov in Data Engineers
свободной почти половина кластера, есть совсем не занятые инстансы
источник

A

Alex in Data Engineers
ну конкретно тут видно что у вас еще другие am запущены
источник

EV

Eduard Vlasov in Data Engineers
10 машн по 7168 в каждой, один контейнер по 3584 включая оверхед
источник

EV

Eduard Vlasov in Data Engineers
запущено 2 AM с 5 контейнерами в каждой
источник

A

Alex in Data Engineers
Queue AM Resource Usage = <memory:7168, vCores:2>;
то есть уже пробили лимит который выставлен

исходя из того что запрос на AM Resource Request = <memory:3584, vCores:1>,
то скорее всего это третье ваше приложение что пытаетесь заранать
источник

EV

Eduard Vlasov in Data Engineers
3 AM не запускается, висит в accepted
источник

EV

Eduard Vlasov in Data Engineers
Alex
Queue AM Resource Usage = <memory:7168, vCores:2>;
то есть уже пробили лимит который выставлен

исходя из того что запрос на AM Resource Request = <memory:3584, vCores:1>,
то скорее всего это третье ваше приложение что пытаетесь заранать
ну вот я и пытаюсь понять где та самя крутилка :)
источник