Size: a a a

2019 April 11

GP

Grigory Pomadchin in Moscow Spark
хотел бы сортированые колл персиста бы делал после сорта
источник

GP

Grigory Pomadchin in Moscow Spark
вдруг ты хочешь просто прочитать
источник

GP

Grigory Pomadchin in Moscow Spark
а потом поразному отсортировать
источник

GP

Grigory Pomadchin in Moscow Spark
и сделать это быстро
источник

GP

Grigory Pomadchin in Moscow Spark
ипут рдд это редко ж просто кодогенерация; обычно читаешь из источника
закешировал то что прочитал

сделал 2 сортировки на уже прочтенном (ну например)
источник

N

Nikolay in Moscow Spark
Значит persist действует только внутри одного stage ?
источник

GP

Grigory Pomadchin in Moscow Spark
я не понимаю, что это значит
источник

GP

Grigory Pomadchin in Moscow Spark
персист физические блоки сейвит
источник

GP

Grigory Pomadchin in Moscow Spark
к стейджам он не привязан
источник

GP

Grigory Pomadchin in Moscow Spark
но возможно в твоей терминологии будет внутри одного стейджа чтоб это не значило
источник

GP

Grigory Pomadchin in Moscow Spark
действует ли? хз
источник

GP

Grigory Pomadchin in Moscow Spark
источник

GP

Grigory Pomadchin in Moscow Spark
в последнем подстейдже стейджа персистеится и доступно для всех последующих подстейджей
источник

AS

Andrey Smirnov in Moscow Spark
Grigory Pomadchin
я не понимаю, что это значит
я думаю речь про то, что после stage происходит spill to disk
источник

GP

Grigory Pomadchin in Moscow Spark
ах; ну или не на диск
источник

AS

Andrey Smirnov in Moscow Spark
Grigory Pomadchin
ах; ну или не на диск
да, но тоже spill, а значит и персист :)
источник

GP

Grigory Pomadchin in Moscow Spark
+
источник

N

Nikolay in Moscow Spark
Andrey Smirnov
я думаю речь про то, что после stage происходит spill to disk
Да.если данные сохранены на диск и код в другом stage читает их с диска, то тот кусок в памяти уже не нужен. Получается, что persist только внутри одного stage    работает
источник

AS

Andrey Smirnov in Moscow Spark
но ты же и в новом stage можешь обратится к данным которые раньше закешировал раньше (в других stage)
источник

GP

Grigory Pomadchin in Moscow Spark
Andrey Smirnov
но ты же и в новом stage можешь обратится к данным которые раньше закешировал раньше (в других stage)
!!
источник