Anton Alekseev
Получается из-за этого ("читать придеться целиком") такое (одна) количество партиций для одного csv получается, верно?
Тут речь о том , что допустим тебе нужна всего пара-тройка колонок, но в csv формате данные хранятся построчно. Чтобы их прочитать и допустим отфильтровать, надо будет разжать всю строку целиком, распарсить ее, чтобы вытащить нужные колонки. По сравнению с колоночным форматом, это очень неэффективно.