Size: a a a

2021 March 04

АЖ

Андрей Жуков... in Data Engineers
да, своп на хадупе больнааа
источник

ME

Mikhail Epikhin in Data Engineers
ну и первый уточняющий вопрос, можно ли избежать свопа? если неравномерный расчет, то делать repartition
источник

ME

Mikhail Epikhin in Data Engineers
ну или память докидывать
источник

N

Nikita Blagodarnyy in Data Engineers
Mikhail Epikhin
А что используете на hadoop воркерах? Просто если что-то джавовое, то вылезать jvm heap на swap всегда больно же
спарк
источник

ME

Mikhail Epikhin in Data Engineers
ну а данные в памяти какие? Стандартный оффлоадинг в диск чем не годится?
источник

ME

Mikhail Epikhin in Data Engineers
Это будет на порядок лучше свопа
источник

ME

Mikhail Epikhin in Data Engineers
Там и сжатие еще можно сделать
источник

АЖ

Андрей Жуков... in Data Engineers
дык лучше ему под шафл дать эти ссд
источник

A

Alex in Data Engineers
Nikita Blagodarnyy
Какие есть мнения по поводу своп разделов на SSD на ходуп-воркерах? Делать или нет?
Ээээ даже интересно зачем?

Вы большой оверкомит памяти в ярне настроили?
источник

A

Alex in Data Engineers
Андрей Жуков
дык лучше ему под шафл дать эти ссд
working directory (туда же и шафл ходит) на ссд норм
источник

АЖ

Андрей Жуков... in Data Engineers
Alex
working directory (туда же и шафл ходит) на ссд норм
ну, именно
источник

UD

Uncel Duk in Data Engineers
Nikita Blagodarnyy
Какие есть мнения по поводу своп разделов на SSD на ходуп-воркерах? Делать или нет?
Защем
источник

A

Alex in Data Engineers
Просто если оверкомит не делали, то странно как он в своп может пролезть

Ярн убьёт приложение если за лимиты вылазит
источник

UD

Uncel Duk in Data Engineers
Если некуда девать ссд, настройте кэш под ярн
источник

UD

Uncel Duk in Data Engineers
источник

N

Nikita Blagodarnyy in Data Engineers
Mikhail Epikhin
ну и первый уточняющий вопрос, можно ли избежать свопа? если неравномерный расчет, то делать repartition
Ну можно, конечно. не создавать его просто. просто все чаще сыплются ошибки jvm, что не может allocate memory. Это обидно, когда джоб 16 часов работал, а потом упал.
источник

UD

Uncel Duk in Data Engineers
Nikita Blagodarnyy
Ну можно, конечно. не создавать его просто. просто все чаще сыплются ошибки jvm, что не может allocate memory. Это обидно, когда джоб 16 часов работал, а потом упал.
Это не только память
источник

UD

Uncel Duk in Data Engineers
Могли тупо уперется в количество замапленных сегментов
источник

UD

Uncel Duk in Data Engineers
Есть крутилка у ведра
источник

N

Nikita Blagodarnyy in Data Engineers
Alex
Ээээ даже интересно зачем?

Вы большой оверкомит памяти в ярне настроили?
Нет, чтобы ошибок выделения избежать. Пусть подольше будет, но хоть как-то отработает.
источник