Size: a a a

2021 September 08

A

Alex in Moscow Spark
usercache да, обычно в воркинг дир ярновских создаётся
источник

ЕГ

Евгений Глотов... in Moscow Spark
Вместо ловли веселья можно соблюдать рекомендации по 80% заполненности)
источник

A

Alex in Moscow Spark
как это гарантирует что кто-то не начал писать бешено ?
источник

N

Nikita Blagodarnyy in Moscow Spark
Ну от этого сата хдд не станет быстрее нвме
источник

A

Alex in Moscow Spark
в этом кстати недочёт ярна
он не трекает сколько пользователь использовал внутри usercache и тд
источник

ЕГ

Евгений Глотов... in Moscow Spark
В соседнем чате говорят ходуб на нвме норм тема, можно 2 в 1 закрыть)
источник

ЕГ

Евгений Глотов... in Moscow Spark
Можно мониторинг и автоматическое прибитие юзера по лимиту внедрить
источник

A

Alex in Moscow Spark
так и живём

правда working dir всё равно на отдельных ssd дисках
в то время как hdfs на hdd
источник

N

Nikita Blagodarnyy in Moscow Spark
Комодити хардваре
источник

ЕГ

Евгений Глотов... in Moscow Spark
Ну сата хотя бы, латенси в иопсы вроде в основном упирается)
источник

Y

Yurgen in Moscow Spark
Создал external table в Hive на Hbase таблицу, так по крайней мере работает фильтрация.
Если нужно джойнить несколько таблиц из Hbase, сейчас сделано временное сохранение больших таблиц в паркет, джойн из паркета затем удаление временных данных. Это стандартная практика для работы с Hbase или можно что-то улучшить?
источник

N

Nikita Blagodarnyy in Moscow Spark
субдшный подход, очень дорогой. отобраться/обогатиться в спарке через hbase api и там же поджойниться на порядки дешевле.
источник

NN

No Name in Moscow Spark
+
источник

NN

No Name in Moscow Spark
Для систематизации:

1. Стейты ложатся в хдфс
2. Весь кэш, который не уместился в памяти, а также весь шаффл и спилл ложатся на диски в yarn usercache?
3. Есть же вроде как ещё отдельные workingdir для всех этих шафлов и кэшей, или он в ярновом кластере и есть usercache?
источник

ЕГ

Евгений Глотов... in Moscow Spark
Можно сделать отдельно, можно на тех же дисках
источник

ЕГ

Евгений Глотов... in Moscow Spark
Два стула
источник

ЕГ

Евгений Глотов... in Moscow Spark
И на обоих пики)
источник

NN

No Name in Moscow Spark
Бле
источник

NN

No Name in Moscow Spark
А какой смысл тогда в ярновский usercache это писать? Насколько я знаю, он вообще не чистится, пока сессию не прибьешь.
источник

ЕГ

Евгений Глотов... in Moscow Spark
Вроде как чистится при завершении джоба. Успешном завершении...
источник