ну вот вычисли экспериментально в какое число портишонов получается нужный тебе размер файлов. зная число строк - получишь некоторый коэффициент К = строк на 1 партицию. Из него можно обратно вычислять количество партиций, зная число строк.
Но надо понимать, что чем меньше выходных партиций, тем ниже параллелизм и тем медленнее все происходит. Так что файлы в 8 Гб может быть так себе история.