Size: a a a

2021 July 30

A

Alex in Moscow Spark
в контейнере где будете запускать ядро со sparkmagic должен находиться токен от кербероса
а вот как его инжектить это уже отдельные танцы
источник

М

Михаил in Moscow Spark
вот я сейчас на этом моменте, не понятно зачем там 2 кейтаба? я сформировал 1 кейтам туза с прокси.юзером.  При подкладке ругается на инвалид роль. Думаю проблема в krb5.conf в поле auth_to_local. Но пока не понял как ее продебажить
источник

М

Михаил in Moscow Spark
Это я про spark-livy. До запросов от пользователей пока не дошел)
источник

A

Alex in Moscow Spark
у нас примерно как тут написано сделано
https://www.slideshare.net/SparkSummit/secured-kerberosbased-spark-notebook-for-data-science-spark-summit-east-talk-by-joy-chakraborty

со своими нюансами
источник

М

Михаил in Moscow Spark
Спасибо, гляну
источник

AN

Aleksey Nikolaev in Moscow Spark
Привет всем. Может кто подсказать - чем грозит выкручивание параметра spark.memory.fraction с дефолтных 0.6 в 0.9 или даже в 1?
источник

VI

Vladimir Ilyushkin in Moscow Spark
Всем привет. Как победить ошибку memoryOverhead? Параметр memoryOverhead выставлен в 30% от параметра executor.memory. пробовал и 50% не помогает.
источник

ЕГ

Евгений Глотов... in Moscow Spark
Лучше таким способом не пытаться побороть оом, нужно разбираться, почему конкретный запрос падает по памяти
источник

ЕГ

Евгений Глотов... in Moscow Spark
Например, если у вас джойн с шаффлом на 10тб, а вы его пытаетесь в 200 партиций выполнить, то будет оом
источник

VI

Vladimir Ilyushkin in Moscow Spark
Можете подробнее объяснить, что делать. Или может знаете, где про это можно почитать ?
источник

VI

Vladimir Ilyushkin in Moscow Spark
И вопрос что подразумеваете под партицией ? На сколько частей разбита таблица или все же в прямом понимании partition by (date) ?
источник

ЕГ

Евгений Глотов... in Moscow Spark
На сколько частей
источник

ЕГ

Евгений Глотов... in Moscow Spark
У вас большой джойн?
источник

VI

Vladimir Ilyushkin in Moscow Spark
5 таблиц
источник

VI

Vladimir Ilyushkin in Moscow Spark
Одна из них 2.9тб
источник

VI

Vladimir Ilyushkin in Moscow Spark
Остальные поменьше
источник

VI

Vladimir Ilyushkin in Moscow Spark
Большую таблицу с фильтром вынес в блок with as
источник

ЕГ

Евгений Глотов... in Moscow Spark
Это в hdfs столько весит?
источник

ЕГ

Евгений Глотов... in Moscow Spark
Какие ресурсы на кластере?
источник

ЕГ

Евгений Глотов... in Moscow Spark
Меняли параметр spark.sql.shuffle.partitions?
источник