Size: a a a

2019 April 11

GP

Grigory Pomadchin in Moscow Spark
дженерик прост подход ему разницы особо нет хранить копию в памяти или на диск блоки кинуть
источник

GP

Grigory Pomadchin in Moscow Spark
источник

N

Nikolay in Moscow Spark
Pavel Klemenkov
А почему такой код вообще должен быть? Ведь партиция уже в памяти у моменту персиста. Дальше осталось её не эвиктить при отсутствии места
Если после этого сразу идёт map, то он же должен создать новый кусок памяти т.к map поменяет записи
источник

GP

Grigory Pomadchin in Moscow Spark
Nikolay
Если после этого сразу идёт map, то он же должен создать новый кусок памяти т.к map поменяет записи
у тебя ленивый даг получается
он заперсистит тока последний вариант перед коллом персиста
источник

GP

Grigory Pomadchin in Moscow Spark
распиши по разным строчкам; тебе не обязательно синглайнейр использовать при написании кода; да и как ты видишь колл персиста анперсиста мутабельный, тяжело понять суть вопроса
источник

GP

Grigory Pomadchin in Moscow Spark
раньше мне кажется persist и cache юнит возвращали
источник

N

Nikolay in Moscow Spark
Grigory Pomadchin
у тебя ленивый даг получается
он заперсистит тока последний вариант перед коллом персиста
Это внутри одного стэйджа. Если другой стэйджа пошел? Вот он заперсистил. Потом я сделал sort, а после sort пошел опять map
источник

N

Nikolay in Moscow Spark
Все, что после сорта. Это же уже в другом stage будет.
источник

GP

Grigory Pomadchin in Moscow Spark
Nikolay
Это внутри одного стэйджа. Если другой стэйджа пошел? Вот он заперсистил. Потом я сделал sort, а после sort пошел опять map
я не понимаю, что написано) и как это к блок менедежру имеет отношение
источник

ZM

ZLoyer Matveev in Moscow Spark
Nikolay
Это внутри одного стэйджа. Если другой стэйджа пошел? Вот он заперсистил. Потом я сделал sort, а после sort пошел опять map
так, а с персистом эта реплика как связана?
источник

GP

Grigory Pomadchin in Moscow Spark
ну тип ты такой менеджер ок да
увидел блок
он отмечен сторедж левелом отмеченым от нона
сделал копию
номера блоков и имена запомнил записал
драйвер типа знает как поулчить их чтоб не вычислять опять
источник

N

Nikolay in Moscow Spark
Я сделал персист. Внутри этого stage данные положили в память. Дсе, что после этого персист могут юзать эту память, то потом в другом stage что будет?
источник

GP

Grigory Pomadchin in Moscow Spark
вся джоба может использовать рдду после персиста
источник

GP

Grigory Pomadchin in Moscow Spark
какая разница что у тебя дальше в физ плане вычислятся будет
источник

GP

Grigory Pomadchin in Moscow Spark
не понимаю вопроса все равно
источник

GP

Grigory Pomadchin in Moscow Spark
стейдж твой - сет тасков

если ты в них ссылаешься на персисченую рдду то в них она переиспользоваться будет
источник

GP

Grigory Pomadchin in Moscow Spark
чо ты хочешь то?)
источник

N

Nikolay in Moscow Spark
Понять . Как persist между stage работает.
источник

N

Nikolay in Moscow Spark
В другом stage уже нет смысла обращаться к первым закешированным данным.
источник

GP

Grigory Pomadchin in Moscow Spark
Nikolay
В другом stage уже нет смысла обращаться к первым закешированным данным.
почему?
источник