Size: a a a

2019 April 11

GP

Grigory Pomadchin in Moscow Spark
видимо сатанситы испольлзуют такую же терминологию, тока так я могу объяснить что они даблят потребление памяти постоянно везде
источник

GP

Grigory Pomadchin in Moscow Spark
Anton Alekseev
++++ на личном опыте подтверждаю, но я исправился))
: D
источник

N

Nikolay in Moscow Spark
Вот я написал persist. Если открыть его код, то он не создаёт новую rdd. Он сохраняет уровень персистита в текущем rdd и его же возвращает.
источник

GP

Grigory Pomadchin in Moscow Spark
Nikolay
Вот я написал persist. Если открыть его код, то он не создаёт новую rdd. Он сохраняет уровень персистита в текущем rdd и его же возвращает.
это уже гуглится
источник

GP

Grigory Pomadchin in Moscow Spark
в чем вопрос то
источник

N

Nikolay in Moscow Spark
Он возвращает self. Сам персист выполняется на экзекьюторе. И вот вопрос в каком именно месте. Вот в моем случае от выполнится в map?
источник

N

Nikolay in Moscow Spark
В какой именно трансформации будет сохранение в память .
источник

GP

Grigory Pomadchin in Moscow Spark
яж сказал - последнтй дс/рдд у тебя сохраняется
источник

GP

Grigory Pomadchin in Moscow Spark
почему не понятно что последний?
источник

GP

Grigory Pomadchin in Moscow Spark
какой должен?
источник

N

Nikolay in Moscow Spark
Непонятно где именно можно увидеть код, который вызывает запись в память. Вот со чтением из памяти все понятно. Можно это увидеть , а где запись. В каком методе какого класса
источник

GP

Grigory Pomadchin in Moscow Spark
Nikolay
Непонятно где именно можно увидеть код, который вызывает запись в память. Вот со чтением из памяти все понятно. Можно это увидеть , а где запись. В каком методе какого класса
источник

GP

Grigory Pomadchin in Moscow Spark
смотри все коллы типа put
источник

PK

Pavel Klemenkov in Moscow Spark
Nikolay
Непонятно где именно можно увидеть код, который вызывает запись в память. Вот со чтением из памяти все понятно. Можно это увидеть , а где запись. В каком методе какого класса
А почему такой код вообще должен быть? Ведь партиция уже в памяти у моменту персиста. Дальше осталось её не эвиктить при отсутствии места
источник

GP

Grigory Pomadchin in Moscow Spark
вообще как вариант! можно посмотреть в рализацию unpersistа
источник

ЕГ

Евгений Глотов... in Moscow Spark
Nikolay
Вот я написал persist. Если открыть его код, то он не создаёт новую rdd. Он сохраняет уровень персистита в текущем rdd и его же возвращает.
Самая фишка, что персист будет выполнен только после вызова действия - сэйв, коллект и т д
источник

GP

Grigory Pomadchin in Moscow Spark
анперсист активный в отличии от персиста который просто помечает блоки как те которые менеджером должны быть заперсисчены после выполнения
источник

GP

Grigory Pomadchin in Moscow Spark
Pavel Klemenkov
А почему такой код вообще должен быть? Ведь партиция уже в памяти у моменту персиста. Дальше осталось её не эвиктить при отсутствии места
ну он ж копию должен сделать, или дампнуть на диск куски байтов которые тяжело рекаверабны
источник

ZM

ZLoyer Matveev in Moscow Spark
Grigory Pomadchin
ну он ж копию должен сделать, или дампнуть на диск куски байтов которые тяжело рекаверабны
а копию зачем? (если ты про память)
источник

GP

Grigory Pomadchin in Moscow Spark
ZLoyer Matveev
а копию зачем? (если ты про память)
ну тип ту он зарелизит, а эту будет держать для доступа
источник