Я вообще из доков не совсем понял как он читает, сразу по нодам кластера или сперва распаковывает драйвером парсит и разливает.😰 Киньте учебником, Learning Spark не пролил свет.
Блин, мой косяк. Вообщем toPandas вообще фейлился по месту и возвращал пустой датафрейм, и не исполнялся по факту, но ошибку не выбрасывал. Только в джобах на вебморде увидел.