Должно работать строго так, как описано. Можно подробнее кейс, как сделана запись, что в сторадже?
И я не использую spark.sql.files.maxPartitionBytes. Этот параметр и spark.sql.files.openCostInBytes подобны двум бамбуковым палочкам, которыми нужно сложить дом из камней))
У меня есть возможность делать свои имплементации FileSourceScanExec, я делаю чтение, как нужно. Соединяю «соседние» по определенным признакам файлы, или читаю строго по файлам. Как мне нужно, так и читаю.