Сталкивались с тем, что на пайспарке метаданные больших таблиц читались быстрее, чем скалой.
(Непартицированная Таблица весом 14ТБ, 60к файлов в одной папке)
Перед запросом нужно было подождать минут 40, пока неймнода передаёт инфу по блокам на драйвер