Size: a a a

2021 September 02

ИК

Иван Калининский... in Moscow Spark
Во время - в смысле до шафла или после? Таки это важно
источник

KR

Kagermanov Ramazan in Moscow Spark
Но у меня при любом количестве партиций получается 32т тасков
источник

KR

Kagermanov Ramazan in Moscow Spark
Меняется только в зависимости от входных данных
источник

Р

Рамик in Moscow Spark
Привет!
возник вопрос про dynamic allocation. сравниваю его с статическим выделением ресурсов и вижу только одни плюсы, есть ли у него недостатки ? стоит ли ему доверять ?
источник

A

Andrey in Moscow Spark
У важной задачи могут забрать ресурсы
источник

AS

Andrey Smirnov in Moscow Spark
Не заберут, если важная задача уже захватила ресурсы
источник

NN

No Name in Moscow Spark
Забрать могут разве что излишек, который она забрала раньше, свыше своей квоты.
источник

AS

Andrey Smirnov in Moscow Spark
Проблема динамика, что он по каждому чиху начинает брать ресурсы, а отдаёт не охотно
источник

VV

Vladislav Verba in Moscow Spark
Привет! А подскажи пожалуйста еще, вы креды ко внешним системам в сенсоры пробрасываете через os.env / хардкод?

Там же оказывается все эти модные ресурсы/моды/пресеты внутри сенсоров недоступны
источник

ЕГ

Евгений Глотов... in Moscow Spark
Есть настройки, через сколько отдавать
источник

VN

Viacheslav Nefedov in Moscow Spark
И внутри сенсоров и внутри пайплайнов. В этом идеология - они независимы экосистемы
источник

VN

Viacheslav Nefedov in Moscow Spark
Да, через env и свои библиотеки, подключаются в каждом пайплайне
источник

VV

Vladislav Verba in Moscow Spark
Понятненько, спасибо большое))
источник
2021 September 07

АА

Артем Анистратов... in Moscow Spark
Ребят, привет! Могли бы поделиться мнением. Я отстаиваю позицию, что в DAG'ах Airflow не стоит размещать код спарк приложения, и вызывать его через PythonOperator (Планируется указывать в качестве мастера yarn на другом сервере). По моему мнению это метафорически сборка машин непосредственно на проезжей части.
Есть ли плюсы у желаемого моими "оппонентами" решения?
источник

ПФ

Паша Финкельштейн... in Moscow Spark
Это скорее в hadoopusers мне кажется
источник

ПФ

Паша Финкельштейн... in Moscow Spark
источник

ПФ

Паша Финкельштейн... in Moscow Spark
Но вообще я не вижу тут катастрофы не считая того, что есть же Спарк сабмит оператор
источник

АА

Артем Анистратов... in Moscow Spark
По моему мнению главные минусы такие:
Неконтролируемый рост размеров ДАГов, которые содержат спарк приложения.
Сложность их дальнейшей поддержки.
Повышение роли создания бэкапов для ДАГов, так как даги будут  содержать логику работы приложения.
источник

ЕГ

Евгений Глотов... in Moscow Spark
Я за декларативные даги вообще - есть конфиг дага, есть конфиги тасков типа источник-приёмник, есть код бизнес-логики тасков, можно всё переиспользовать, легко разложить в гит и менять по необходимости, даг на лету своей либой из этого всего собирать
источник

ЕГ

Евгений Глотов... in Moscow Spark
Сложность не только поддержки, но и разработки
Атомарный кусок кода бизнес-логики можно обложить автотестом, а когда он внутрь эйрфлоу дага засунут, что с ним делать? Как его отдельно запустить, не копировать же
источник