Вот допустим у меня простой rdd. Там 10 рэндомных чисел. Я поставил persist. Он их закешировал в память. Дальнейшем я сортируются их. Сортировка заканчивает текущий stage. Данные упорялоченные после нее и записаны на диск. ? В следующий момент я делаю map. Зачем мне первый cache в это месте ?
Вот допустим у меня простой rdd. Там 10 рэндомных чисел. Я поставил persist. Он их закешировал в память. Дальнейшем я сортируются их. Сортировка заканчивает текущий stage. Данные упорялоченные после нее и записаны на диск. ? В следующий момент я делаю map. Зачем мне первый cache в это месте ?