Size: a a a

2021 September 08

N

Nikita Blagodarnyy in Moscow Spark
Ну это ж будет на порядки медленнее. Чем дефолтный темп смонтировать на ссд волюм.
источник

A

Alex in Moscow Spark
а можно ссылку на код?
что-то я не помню такого
источник

ЕГ

Евгений Глотов... in Moscow Spark
Ссылку хз, но инфа сотка
источник

A

Alex in Moscow Spark
кубик требует жертв, если хотите динамик скейл спарк кластера
в отличии от yarn где можно зарегать агента и само приложение потушить, в кубике так не прокатит
источник

N

Nikita Blagodarnyy in Moscow Spark
Вообще необязательно. Под систему обычно ставят ссд, а дефолтный путь /tmp обычно туда и смотрит.
источник

ЕГ

Евгений Глотов... in Moscow Spark
Поэтому и появилась рекомендация хдп держать не больше 80% кластера забитым
источник

ЕГ

Евгений Глотов... in Moscow Spark
Так как 20% под шафл используется
источник

ЕГ

Евгений Глотов... in Moscow Spark
Был у нас как-то ходуб с темп на ссд...
источник

ЕГ

Евгений Глотов... in Moscow Spark
Из бракованной партии со скидосом...)
источник

N

Nikita Blagodarnyy in Moscow Spark
Речь про то, что на воркер ноде диски используются и хдфс тоже
источник

A

Alex in Moscow Spark
аааа, ну это понятно, но под working dir у нас отдельные ссд смонтированы
источник

A

Alex in Moscow Spark
возможно патчи хортона/клоудеры, просто я не помню чтобы там это было
в 3м что-то начинали делать, но чтобы уже работало я не помню

стейт да, уезжает в хдвф
а вот cache и спилы только в локал диски
источник

N

Nikita Blagodarnyy in Moscow Spark
Ну мониторинг там, алертинг, смарт и всё такое.
источник

A

Alex in Moscow Spark
источник

ЕГ

Евгений Глотов... in Moscow Spark
Он не совсем в hdfs сохраняет, просто рядом на те же диски, если я ничего не путаю
источник

ЕГ

Евгений Глотов... in Moscow Spark
Есть ещё такая штука, как yarn usercache, возможно это всё вписывается туда
источник

ЕГ

Евгений Глотов... in Moscow Spark
Так как шафлы на терабайт вызывали увеличение юзеркеша на терабайт
источник

A

Alex in Moscow Spark
а, да, тогда верно
просто как уже сказано "hdfs диски отдельно, yarn working dir диски отдельно"
если конечно не хочется поймать веселье в проде когда кто-нибудь в yarn начинает генерировать вагоны логов/спилов/тд
источник

N

Nikita Blagodarnyy in Moscow Spark
Возьми кароч свои ключи и в маппортишоне по хбейс апи обогати. Точно будет более лутше, понятнее и управляемее.
источник

ЕГ

Евгений Глотов... in Moscow Spark
Стораж левел = диск, вопрос в том, какой именно это будет диск
источник