Size: a a a

2019 June 26

DZ

Dmitry Zuev in Moscow Spark
А запуск с тем же мультом разных версий вилов?
источник

PK

Pavel Klemenkov in Moscow Spark
Тоже говно. Но с вилами, обычно, такого не бывает. За это бьют по рукам админы и ставят одну версию через оркестратор
источник

PK

Pavel Klemenkov in Moscow Spark
Ток с контейнерами я такую анархию видел
источник

K

KrivdaTheTriewe in Moscow Spark
Ну контейнеры для неё и созданы
источник

K

KrivdaTheTriewe in Moscow Spark
Можно свой базовый образ сделать
источник

DZ

Dmitry Zuev in Moscow Spark
Pavel Klemenkov
Тоже говно. Но с вилами, обычно, такого не бывает. За это бьют по рукам админы и ставят одну версию через оркестратор
вот про это и разговор, что не хочу админов.
Хочу сиай сиди. Собрал свои зависимости как хочешь и заделиверил
источник

DZ

Dmitry Zuev in Moscow Spark
KrivdaTheTriewe
Можно свой базовый образ сделать
там все равно для спарка базовый образ и так
источник

GP

Grigory Pomadchin in Moscow Spark
Dmitry Zuev
вот про это и разговор, что не хочу админов.
Хочу сиай сиди. Собрал свои зависимости как хочешь и заделиверил
одмены для поддержки кубера нужны будут
источник

GP

Grigory Pomadchin in Moscow Spark
оно там не все гладко
источник

GP

Grigory Pomadchin in Moscow Spark
опсы пилить напильником его и материться регулярно могут
источник

DZ

Dmitry Zuev in Moscow Spark
источник

DZ

Dmitry Zuev in Moscow Spark
Ну gke все таки это не голый сетап
источник

K

KrivdaTheTriewe in Moscow Spark
Dmitry Zuev
там все равно для спарка базовый образ и так
А вдруг тебе в хбейз ходить нужно
источник

K

KrivdaTheTriewe in Moscow Spark
Или бинарничек какой
источник

DZ

Dmitry Zuev in Moscow Spark
Да я не про это
источник

DZ

Dmitry Zuev in Moscow Spark
Я про то что там и так нужно юзать как основу конкретный образ
источник

DZ

Dmitry Zuev in Moscow Spark
KrivdaTheTriewe
Или бинарничек какой
а за это я и топлю. Что докер и хорош тем что любые бинарки в любых версиях.
Еще и в случае кубера если нод докинули то не надо колеса крутить.
источник
2019 June 28

D

Datamove in Moscow Spark
Привет, Коллеги! Вопрос к практикующим.
Есть спарк с хадупом, стандартный дистрибутив HDP.
Есть некая задача агрегации данных, которую надо запускать как батч или стрим, и она читает из кафки и пишет в кафку. Топиков много, задач надо много запускать, но код одинаковый. *Вопрос: Как вы параметризуете задачи?*. Т.е. чтоб передавать, например, топики как параметры?
Я такое пытался делать:
в программу передается название приложения, по нему читается из конфига параметры:
appName = sys.argv[1]
spark = SparkSession.builder.appName(appName).getOrCreate()
topic_in = spark.conf.get("spark."+appName+".topic_in")
такой конфиг можно, например, хранить в zookeeper.
Меня интересует, есть ли какой-то более правильный и удобный способ?
Вопрос, повторяю, на стандартном кластере, а не в облаке, не для кубернетеса и проч. Спасибо заранее!
источник

PK

Pavel Klemenkov in Moscow Spark
@tenKe это к тебе
источник

K

KrivdaTheTriewe in Moscow Spark
мы сделали велосипед  дикий ?но работающий, аргументом передается hocon конфиг(прям так) и парсится pureconfig в case class
источник