Еще вопрос вдогонку) У меня Spark при записи в паркет почему-то какое-то из float-колонок(или даже не одно поле) начинает писать в словарь. Из-за этого запись в паркет растягивается на 3 часа вместо 10-ти минут. Отключение словаря sqlContext.setConf("parquet.enable.dictionary", "false") решает проблему, однако хочется , чтобы для остальных колонок механизм отрабатывал, когда надо. Можно отрубить dictionary только на определенные поля?