Size: a a a

2019 August 25

GP

Grigory Pomadchin in Data Engineers
Паша Финкельштейн
Если партиция не в оффхипе - какая разница какого она размера? Всё равно надо всё регионы помаркать свободным
во время шаффла спарк шлет партиции
источник

GP

Grigory Pomadchin in Data Engineers
чем меньше кусочки
источник

GP

Grigory Pomadchin in Data Engineers
тем проще
источник

GP

Grigory Pomadchin in Data Engineers
)))
источник

GP

Grigory Pomadchin in Data Engineers
не знаю о чем ты писал но я про это упомянул размер партции и почему они маленькие обычно
источник

ПФ

Паша Финкельштейн in Data Engineers
Ага, я понял
источник

ПФ

Паша Финкельштейн in Data Engineers
Это же объясняет почему сериал не смотрели
источник

ПФ

Паша Финкельштейн in Data Engineers
Решили что если приложение пересылает данных больше чем хип - то сериал будет съедать всё время исполнения
источник

ПФ

Паша Финкельштейн in Data Engineers
Потому что постоянно будет слишком много мусора
источник

GP

Grigory Pomadchin in Data Engineers
Паша Финкельштейн
Это же объясняет почему сериал не смотрели
думаю потому что паралелизм в их случая большой и на каждом ехекуторе мног отасок раниться может
источник

GP

Grigory Pomadchin in Data Engineers
и им не выгодно ждать компакшена после каждого гц
источник

GP

Grigory Pomadchin in Data Engineers
но я хз чс гвооря
источник

GP

Grigory Pomadchin in Data Engineers
я не пробовал вообще сериал со спарком; казалось глупо
источник

GP

Grigory Pomadchin in Data Engineers
Паша Финкельштейн
Решили что если приложение пересылает данных больше чем хип - то сериал будет съедать всё время исполнения
да мне кажется так и будет
источник

GP

Grigory Pomadchin in Data Engineers
обычно поэтому даже параллел используется а не смс
источник

GP

Grigory Pomadchin in Data Engineers
на джобах которые не бесконечные
источник

ПФ

Паша Финкельштейн in Data Engineers
Ну это пофиг, в рамках одной жвм сериал всегда будет быстрым. Ну да, у них больше гц рутов, но и фиг с ним, всё равно математика очень простая. А вот то что в памяти много мусора - это проблема
источник

GP

Grigory Pomadchin in Data Engineers
+
источник

GP

Grigory Pomadchin in Data Engineers
ну у тебя мног ообектов и преша большая
источник

GP

Grigory Pomadchin in Data Engineers
источник