Size: a a a

2021 April 27

ИК

Иван Калининский... in Data Engineers
источник

GP

Grigory Pomadchin in Data Engineers
надо забить просто на пар коллекции)
источник

GP

Grigory Pomadchin in Data Engineers
есть компат с ними кстати
источник

GP

Grigory Pomadchin in Data Engineers
официальный
источник

РВ

Рябуша Владимир... in Data Engineers
Привет, Ваня) мне кажется....вряд ли это с локальной файловой системой (думается так). Потому что ребут кластера помогает. Думаю рыть нужно в сторону памяти. Выглядит так, что один контейнер киляется из за того, что начинает жрать больше памяти, и соответственно редьюсер не может вычитать из него данные.  (Там же про шафл речь). Может еще стоит поиграть хип сайз для контейнеров?
источник

ИК

Иван Калининский... in Data Engineers
шедулер назначит пересчёт партиций, шафл файлы которых утрачены, и выполнение продолжится
источник

ИК

Иван Калининский... in Data Engineers
это будет видно в Spark UI, стейджи будут ретраиться, но не полностью, а только несколько тасков
источник

ИК

Иван Калининский... in Data Engineers
Привет, Володя!
источник

ИК

Иван Калининский... in Data Engineers
с этого, конечно, мне стоило начать ))
источник

РВ

Рябуша Владимир... in Data Engineers
Ну так да... если у нас переполняется для контейнера хип во время шафл, то у тебя идет зависимость контейнера редюсера от мапера. Т.е. контейнер где мап задача посчиталась перезапустится, но редюсеру от этого не легче
источник

ИК

Иван Калининский... in Data Engineers
редюсер - что ты имеешь в виду под этим термином?
источник

SK

Stanislav Klevtsov in Data Engineers
@Ryabusha и тебе )
источник

РВ

Рябуша Владимир... in Data Engineers
Экзекьютер в который льются пошафленые данные
источник

GP

Grigory Pomadchin in Data Engineers
тоже так думаю, мне кажется видел такое иногда
источник

GP

Grigory Pomadchin in Data Engineers
на лонг раннинг жобах
источник

GP

Grigory Pomadchin in Data Engineers
давно ток было ничего не помню и это не правда
источник

ИК

Иван Калининский... in Data Engineers
Это может быть тот же самый экзекутор, который эти данные записал. Всё дело в том, какой стейдж он выполняет. И к моменту начала стейдж все шафл-файлы уже записаны предыдущим стейджем, ExchangeCoordinator (тут я могу ошибаться с названием класса, если что, потом исправлю) держит инфу о файлах, и знает, какие надо пересчитать. Проще говоря, спарк готов к тому, что некоторые экзекуторы будут убиты или погашены динамической аллокацией
источник

A

Aleksandra in Data Engineers
И есть, наверняка, какое-то максимальное число попыток пересчитать утерянные шафл-файлы?
источник

NN

No Name in Data Engineers
Ну, кстати, хз. Я вот наблюдал однажды, наверное, бесконечный такой цикл, который, если б не убил, то крутился бы до второго пришествия.
источник

ИК

Иван Калининский... in Data Engineers
В пределах стейджа это число 4 по умолчанию, между стейджами - не могу сейчас точно сказать
источник