Телеграмм чат группы hadoopusers страница 1978

Нарлд не закидываете тапками, насколько плоха идея запускать yarn внтури другого оркестратора?

14:59пожаловаться #1

А почему именно yarn? А HDFS?

15:04пожаловаться #2

А почему именно yarn? А HDFS?

Для spark кластера

15:04пожаловаться #3

РА

а на каком планируете запускать?

15:04пожаловаться #4

Spark кластер умеет и без yarn (как standalone например).

15:05пожаловаться #5

Вижу так, раскатать на впс swarm/nomad а внутри него задеплоить контейнеры с yarn

15:05пожаловаться #6

Spark кластер умеет и без yarn (как standalone например).

Spark-submit в кластер режиме в стендалон не умеет

15:06пожаловаться #7

РА

проще уж тогда раскатать кубик и в нем уже спарк

15:06пожаловаться #8

РА

а еще у спарка есть свой кластер

15:06пожаловаться #9

Рамиль Ахмадеев

а еще у спарка есть свой кластер

Spark-submit в кластер режиме в стендалон не умеет

15:07пожаловаться #10

Рамиль Ахмадеев

проще уж тогда раскатать кубик и в нем уже спарк

У нас нет компетенции в кубике😅

15:07пожаловаться #11

Просто вопрос скорее в том как раскатывать yarn с помощью ansible или можно его в образ докера закатать почти безболезненно

15:08пожаловаться #12

РА

ну тогда делайте матрешку

15:08пожаловаться #13

РА

кроме доп. оверхеда это ни чем особо не грозит

15:08пожаловаться #14

Sergej Khakhulin

Spark-submit в кластер режиме в стендалон не умеет

В смысле? Можно вполне поднять standalone cluster и запускать джобы распределенно.

15:09пожаловаться #15

РА

Sergej Khakhulin

т.к. это под спарк то с дискими вроде особой нужды нет работать, как это бывает у части ярн приложений, поэтому можно хоть так, хоть так по мне

15:09пожаловаться #16

Просто вам тогда нужно какое-то общее хранилище. S3 например.

15:09пожаловаться #17

В смысле? Можно вполне поднять standalone cluster и запускать джобы распределенно.

В стенд алон можно сабмитить только в клиент режиме что черновато Спарк драйвером на ноде которая делает сабмит

15:10пожаловаться #18

Просто вам тогда нужно какое-то общее хранилище. S3 например.

Есть s3 минио в дистрибьютер моде

15:11пожаловаться #19

Ну хз, разворачивать yarn только чтобы запускать driver на другой ноде. Такое.