Size: a a a

2021 June 30

AB

Andrey Bel in Data Engineers
Привет, а когда запускаешь в спарк сабмит скок памяти даёшь?
источник

RI

Rustam Iksanov in Data Engineers
А есть ошибка, с которой падает? Может стоит посмотреть как спарком делаешь джоины? И еще памяти можно добавить на экзекьютор и драйвер
источник

AB

Andrey Bel in Data Engineers
+
Да я про это тоже
Ну тут недавно советовали олдовые ребята статистику вывести, я ток команду хз куда записал - ноут менял)) можно в истории поискать по оом
источник

AF

Anna Flyingby in Data Engineers
Да, я не гуру, я несчастный ораклист, запрос у меня трёхэтажный, поэтому спарк запускаю через билайн. Настройки у меня только на драйвер мемори - 16 гб и экзекьютор 8, больше боливар не выдерживает. Ошибка mapjoinmemoryexaustionexception
источник

AB

Andrey Bel in Data Engineers
Памяти норм, обычно наоборот даже)
Тут гуру ток лет после 5 - 7 наверное так что большинство не гуру нн парься 👆
Чёт нн так с джоином это точно
источник

AB

Andrey Bel in Data Engineers
В почему через билайн в не просто спарк сабмит через терминал? Может ошибка бы кусок кода показала, хотя это часто нн о совпадает с реальностью
источник

AB

Andrey Bel in Data Engineers
Вот, нашёл 👆
источник

AF

Anna Flyingby in Data Engineers
Спасибо, Сейчас погуглю спарк сабмит, знаю только про спарк шелл и :paste, но он меня сильно не радует:(
источник

AF

Anna Flyingby in Data Engineers
Спасибо ещё раз, тоже погуглю
источник

AB

Andrey Bel in Data Engineers
В шеле вы код пишите и там же запускаете, а в спарк сабмит запускает ваш джарник на кластере, это стандартная команда
источник

AB

Andrey Bel in Data Engineers
Не за что, вы молодец, уже спать пора а вы со спарком, настоящий ДЕ 👆👍
источник

NN

No Name in Data Engineers
А сколько экзекуторов поднимается? Сколько коров на экзекутор? Возможно, нужно повысить уровень параллелизма.
источник

AF

Anna Flyingby in Data Engineers
6 на экзекьюторы, 8 на драйвер, это опять же максимум для этого кластера:(
источник

AF

Anna Flyingby in Data Engineers
У меня последний день удалёнки, а ночью кластер целиком мой - пытаюсь вот добить отладку:)
источник

AB

Andrey Bel in Data Engineers
👍
источник

NN

No Name in Data Engineers
8 ядер на драйвер? Зачем?
На экзекьюторе можно при этом попробовать уменьшить количество коров, чтобы у каждого было больше памяти. При этом можно уменьшить память на драйвере, и докинуть на экзекуторе.
Но это все теория, потому что я не знаю Ваш запрос.
источник

K

KrivdaTheTriewe in Data Engineers
Назрел вопрос, кто с эирфлоу на что  мигрировал , например арго?
источник

AF

Anna Flyingby in Data Engineers
Попробую сейчас. Запрос обычный, 4 таблицы, обычный джойн, смысл - достать к айди из 1ой таблицы некое значение из 4ой, ну и я подозреваю, что 4ая таблица кривовата, чем - не понимаю, я её почистила подселектом, оставила 2 нужных поля и убрала кривые айдишники, но нет.  Без 4 таблицы всё работает, но нужное значение в ней:(
источник

AB

Andrey Bel in Data Engineers
Нв край сохраните результат 3 джоинов а том след шагом /джобой решающий джоин сделайте, так же в спарк ui можно глянуть может что-то нн так идёт, там каунты хотя-бы можно посмотреть и тд
источник

AF

Anna Flyingby in Data Engineers
Не заработало:( гадская таблица:((
источник