Телеграмм чат группы hadoopusers страница 3294

ну и да, зависит от объемов и стека, если хранилище хорошо работает на жирном сервере ПГ, а пайплайны это просто сиквел через дбт - то конечно кубера хватит, чисто чтобы воркеров эйрфлоу запускать

источник

01:30пожаловаться #13

KrivdaTheTriewe in Data Engineers

Grigory Pomadchin

но минио тоже вариант так та

нет

источник

01:31пожаловаться #14

Grigory Pomadchin in Data Engineers

я не понимаю это боты какие-то которые вечно презаходят или что

источник

04:52пожаловаться #15

Alex in Data Engineers

Grigory Pomadchin

спарки на ярне 3 работают как и на ярне 2 афаик
не знаю можно ли заставить спарки в докер контейнерах под ярном работать

но наверн както можно - у ярна там сеттингов милиард

Ещё год назад запускал спарк и в докер контейнерах на ярне, кластер собирался, secured hdfs работал, керберос авторизация проходила

Библиотеки hadoop монтировал с хост системы чтобы с собой не таскать

источник

06:39пожаловаться #16

Grigory Pomadchin in Data Engineers

Alex

удобно? расскажи как запускать сча спарк на ярне?

источник

06:40пожаловаться #17

Grigory Pomadchin in Data Engineers

Хочу чтоб у меня под каждый старт жобы свой имедж был

источник

06:40пожаловаться #18

Alex in Data Engineers

KrivdaTheTriewe

а что если не дай бох, я хочу запустить джаву 16

Тут будут основные проблемы чтобы hdfs либы полетели, а с ними проблемы на клиенте не замечал

Просто в конфигурации приложения указываете java_home какой хотите использовать, ноде менеджер будет использовать его

Можно указывать прямо в момент Spark-submit, для драйвера одно, для воркеров другое

источник

06:42пожаловаться #19

Alex in Data Engineers

Grigory Pomadchin

удобно? расскажи как запускать сча спарк на ярне?

Спарк ничего нового относительно обычной джобы в докер ярне не требует, немного плясок было с другим

1. У хортона под питон 2й был скрипт, в контейнере только 3й, соответственно что-то не отработалось (нужно глянуть что там было, не вспомню)
2. Во время тестов у меня в контейнере своя джава стояла для тестов, по другим путям чем на хосте, пришлось пару параметров докинуть где её брать (оттуда и узнал что без проблем переписывается на сабмите пути)
3 как и вообще весь докер на ярне. Может быть медленный старт из-за того что образы качаются, только в 3.3 довезли чтобы они повторно pull делали для проверки обновлений, иначе раз закешировавшишь он там живёт постоянно(решали давая новый тег на ребилде образа или ансибл скриптами пулл делали, чтобы джобы не рескедулить с новым тегом) , не чистились скачанные имейджи (вроде уже пофиксили, нужно смотреть)

источник

06:48пожаловаться #20