DE, я тут голову сломал. Может есть у кого опыт. Есть RDD с V в виде строк, необходимо запихать V в файл зажатый zip. При этом файл должен быть 1 и entry в zip тоже должно быть 1. Сейчас это у меня занимает по времени примерно 1 час, размер файла zip 1 GB, размер несжатого файла 29GB. Все это работает в 1 поток, выполнение на экзекуторе. Небольшое ускорение получил когда запихал это все в память, а затем слил в файл. Что можно сделать ? SNNAPY пробовал рулит, но по tz не входит. Хорошо что arj не предложили, а могли :0