Size: a a a

2019 August 09

ЕГ

Евгений Глотов in Data Engineers
Конфиг прям в функцию прописывается
источник

AZ

Anton Zadorozhniy in Data Engineers
у пайспарка беда с безопасностью
источник

ЕГ

Евгений Глотов in Data Engineers
А спарк в принципе уже на нодах везде есть, поэтому я просто прописываю spark_home
источник

A

Alex in Data Engineers
Евгений что делать если нужно много версий разных держать?
источник

AZ

Anton Zadorozhniy in Data Engineers
там либо надо выдать китаб каждому пользователю, либо всех запускать от имени одного пользователя, оба варианта плохие
источник

ЕГ

Евгений Глотов in Data Engineers
Но бывает, что импортируют pyspark.sql.* до того, как запустят мою функцию, которая всё настраивает
источник

AZ

Anton Zadorozhniy in Data Engineers
у варианта спаркмэджик + ливи можно имперсонировать пользователя нормально
источник

ЕГ

Евгений Глотов in Data Engineers
И тогда если уже установлен другой спарк из пипа на клиенте, вылезают ошибки
источник

ЕГ

Евгений Глотов in Data Engineers
Потому что импортировалось одно, а на нодах другое
источник

ЕГ

Евгений Глотов in Data Engineers
Спаркмэджик какой-то кривой, как мне показалось
источник

ЕГ

Евгений Глотов in Data Engineers
У меня получилось создать две сессии из одного ноутбучика
источник

A

Alex in Data Engineers
ну … =) костыли они везде есть
источник

AZ

Anton Zadorozhniy in Data Engineers
Евгений Глотов
Потому что импортировалось одно, а на нодах другое
кмк вы не очень точно представляете как yarn работает, там конфиг с клиента используется экзекьютором уже на любой ноде, и все дальше работает так как указано на клиенте в момент запуска
источник

ЕГ

Евгений Глотов in Data Engineers
Anton Zadorozhniy
там либо надо выдать китаб каждому пользователю, либо всех запускать от имени одного пользователя, оба варианта плохие
Мы кинит делаем каждый раз...)
источник

AZ

Anton Zadorozhniy in Data Engineers
Евгений Глотов
Мы кинит делаем каждый раз...)
жуть какая)
источник

ЕГ

Евгений Глотов in Data Engineers
Да не может оно так работать, код другой в класспасе
источник

AZ

Anton Zadorozhniy in Data Engineers
Евгений Глотов
Да не может оно так работать, код другой в класспасе
ну вам виднее)
источник

ЕГ

Евгений Глотов in Data Engineers
Ну короче мы кучу багов на этом словили
источник

ЕГ

Евгений Глотов in Data Engineers
Когда кто-то пип инсталл пайспарк делает в общее окружение)
источник

A

Alex in Data Engineers
Евгений Глотов
Да не может оно так работать, код другой в класспасе
может не стоит спарк в класпас для ярн нод добавлять? =)
источник